Hoe de functie Hum to Search van Google werkt

Inhoudsopgave:

Hoe de functie Hum to Search van Google werkt
Hoe de functie Hum to Search van Google werkt
Anonim

Belangrijkste afhaalrestaurants

  • Google heeft een nieuwe tool gelanceerd waarmee gebruikers naar nummers kunnen zoeken door te neuriën, te zingen of te fluiten.
  • De nieuwe tool maakt gebruik van machine learning om een neuriënd nummer te matchen met een database van meer dan een half miljoen nummers die voortdurend wordt bijgewerkt.
  • Google-gebruikers vragen welk nummer bijna 100 keer per maand wordt afgespeeld.
Image
Image

Google heeft een nieuwe functie gelanceerd met de naam 'Hum to Search' om een frustrerend probleem op te lossen: een nummer in je hoofd hebben en niet kunnen achterhalen hoe het heet.

Het idee om te neuriën om een nummer te vinden lijkt ongelooflijk eenvoudig, dus waarom lanceert Google deze functie pas in 2020? Nou, het blijkt dat het identificeren van nummers op deze manier eigenlijk behoorlijk ingewikkeld is, deels omdat onze geneuriede versies nogal verschillen van het originele nummer. In een recent bericht op zijn AI-blog legt Google uit hoe het machine learning heeft gebruikt om dit probleem op te lossen en uiteindelijk mensen helpt een nummer te vinden door de melodie te neuriën, te fluiten of te zingen, zelfs als hun weergave minder dan nauwkeurig is.

"Onze focus voor Hum to Search ligt op het helpen van mensen bij het identificeren en vinden van muziek die in hun hoofd blijft hangen", vertelde een Google-woordvoerder aan Lifewire in een e-mail.

Begin gewoon te neuriën

Google-gebruikers vragen welk nummer bijna 100 miljoen keer per maand wordt afgespeeld, zei Aparna Chennapragada, vice-president en algemeen directeur van consumentenwinkelen van Google, in een video waarin verschillende nieuwe zoekfuncties worden geïntroduceerd. Nu is er een manier om erachter te komen.

De functie "Hum to Search" is ingebouwd in de mobiele app van Google, de Google Zoeken-widget en de Google Assistent. Om het via de app te openen, tik je op het microfoonpictogram en zeg je 'Wat is dit nummer?' Het selecteren van de knop "Zoek een nummer" werkt ook.

Om correct te werken, moet je voor de functie minimaal 10-15 seconden neuriën. Android-gebruikers kunnen neuriën om nummers in meer dan 20 talen te vinden, terwijl op iPhones alleen Engelse nummers werken. De tool kan een nummer niet altijd meteen identificeren, maar als dat het geval is, zijn de resultaten redelijk goed.

"Meer dan de helft van de nummers van een brede reeks variabelen (toon, toonhoogte, volume, enz.) worden herkend door onze algoritmen, maar de nauwkeurigheid hangt natuurlijk af van de kwaliteit van het neuriën, het type het nummer, en meer", vertelde de Google-woordvoerder in een e-mail aan Lifewire. "Maar als het eenmaal wordt herkend, zijn ongeveer vier van de vijf antwoorden correct."

Dit is echter niet de eerste keer dat neuriën wordt gebruikt in een app voor het identificeren van muziek. SoundHound biedt een vergelijkbare functie, zoals opgemerkt door CNN Business, en is ook beschikbaar op Android en iOS. Volgens de Google-woordvoerder roept de nieuwe functie geen privacyproblemen op, noch verandert het "de manier waarop Google omgaat met op audio gebaseerde interacties", vertelden ze Lifewire in een e-mail.

Machineleren

Ondanks de eenvoud van het concept, is het technisch vrij moeilijk om een deuntje te neuriën om de studio-opname te vinden. Daar zijn verschillende redenen voor, legt Christian Frank van Google Research uit in een blogpost van 12 november. Allereerst kan een geneuriede versie van het nummer sterk verschillen van de eigenlijke opname, waardoor het moeilijk is om de twee te matchen. Dus hoewel Shazam en een groot aantal andere apps al bestaan om dat nummer te identificeren dat je in een restaurant of andere openbare plaats hoort, kan het lastiger zijn om een neuriënde melodie te gebruiken als basis voor die zoekopdracht.

"Met teksten, achtergrondzang en instrumenten kan de audio van een musical of studio-opname heel anders zijn dan een neuriënd deuntje", schrijft Frank."Per ongeluk of ontwerp, wanneer iemand hun interpretatie van een nummer neuriet, kunnen de toonhoogte, toonsoort, tempo of ritme vaak licht of zelfs aanzienlijk variëren."

Image
Image

Omdat de neuriënde versies van nummers zo kunnen verschillen van de originelen, merkt Frank op dat voor veel methoden uit het verleden het neuriën van een persoon moest worden afgestemd op een versie van het nummer die alleen een melodie heeft, of een nummer dat neuriën bevat. Dit heeft het gebruik in de echte wereld tot een uitdaging gemaakt, omdat de databases met die nummers beperkt kunnen zijn en handmatig moeten worden bijgewerkt.

Google legt uit dat voor de functie Hum to Search machine learning-modellen worden gebruikt om audio om te zetten in een "op nummers gebaseerde reeks" die de melodie van het nummer vertegenwoordigt - wat het zegt, kan worden gezien als een "vingerafdruk."

Gebruiksvriendelijker

Het gebruik van machine learning in de functie Hum to Search van Google maakt de tool uiteindelijk een stuk gemakkelijker te gebruiken in de echte wereld. Omdat Hum to Search het neuriënde deuntje van de zoeker matcht met het eigenlijke nummer, kan de tool met de nieuwe nummers werken wanneer ze worden uitgebracht in plaats van een database die constant moet worden bijgewerkt met neuriënde versies van elk nummer. Bovendien heb je geen perfecte toonhoogte nodig om het te gebruiken.

"Het huidige systeem bereikt een hoge mate van nauwkeurigheid in een database met nummers die meer dan een half miljoen nummers bevat die we voortdurend bijwerken", zei Google in de aankondiging van Hum to Search. "Dit songcorpus heeft nog ruimte om te groeien om meer van 's werelds vele melodieën op te nemen."

Aanbevolen: