YouTube zal neurale netwerken gebruiken om video's echt te begrijpen
YouTube zoeken YouTube opzoeken als een PRO met Google Geavanceerde operators YouTube opzoeken als een PRO met Google Geavanceerde operators Meer lezen kan een frustrerende ervaring zijn; als je weet waar een video over gaat of als je de inhoud maar niet de naam onthoudt, zou je heel lang kunnen zoeken. Dat komt omdat YouTube niet echt werkt zien de video's zoals iemand dat doet. Het ziet alleen de metadata - titel, beschrijving en tags. En dat veronderstelt dat de uploader de moeite neemt om de informatie op te nemen.
Dit alles zou in de nabije toekomst kunnen veranderen. Google diende onlangs een patent in dat aangeeft dat YouTube daadwerkelijk zou kunnen beginnen begrijpen de video's die worden afgespeeld.
Relevantie-gebaseerde beeldselectie
De octrooiaanvraag van Google is voor “op relevantie gebaseerde selectie van afbeeldingen,” een mooie manier van zeggen “het vinden van de dingen die iemand zocht op basis van wat er in een video staat.” In het systeem dat in het octrooi is uitgewerkt, wordt een algoritme getraind om specifieke functies van elke video te extraheren en er trefwoorden aan toe te wijzen. Vervolgens kan het een video retourneren als reactie op een door de gebruiker gestarte zoekopdracht met die zoekwoorden.
De applicatie geeft een interessant voorbeeld:
“[I] f de gebruiker voert de zoekopdracht in “autorace,” de videozoekmachine ... kan een autosportscène uit een film vinden en retourneren, ook al is de scène mogelijk slechts een klein deel van de film die niet in de tekstuele metadata wordt beschreven.”
Uiteraard zal dit de manier waarop een YouTube-zoekopdracht effectief is, drastisch veranderen. Video's die eerder onbereikbaar waren vanwege slechte metadata, worden gevonden. Video's met nuttige clips in het midden, omringd door minder interessante dingen aan het begin en het einde, zullen veel waardevoller zijn. TED-talkvideo's 8 TED Talks-video's die minder dan 5 minuten duren U wilt 8 TED-talks bekijken Video's die minder dan 5 minuten duren U wilt kijken Hebt u vijf minuten om te doden? Wat is een betere manier om die tijd door te brengen dan een fascinerende of informatieve TED Talks-video te bekijken. Er is veel geweldige content beschikbaar om te bekijken op TED, maar soms ... Read More zal te vinden zijn op basis van enkele regels die erin worden gesproken. Je kunt zelfs video's van katten vinden “kat” staat niet in de titel.
Het combineren van deze technologie met het al indrukwekkende vermogen van Google om dingen te vinden die gerelateerd zijn aan uw zoektermen, betekent waarschijnlijk dat het vinden van video's een heel andere ervaring wordt. Je ziet gerelateerde video's die je zoekterm niet bevatten, maar een verwante term bevatten (misschien zelfs visueel gerelateerd). Het visuele equivalent van plaatsing van zoekwoorden kan van invloed zijn op de plaats waar een video in de ranglijst wordt weergegeven. Wie weet hoe geavanceerd dit zou kunnen zijn?
Hoe werkt het?
Google houdt begrijpelijkerwijs hun kaarten dicht bij hun borst op deze. De volgende paragraaf in hun octrooiaanvraag werpt echter enig licht op hoe ze YouTube zover krijgen “zien” videos:
“In één aspect genereert een computersysteem de doorzoekbare video-index met behulp van een machine-geleerde model 4 Machineleeralgoritmen die uw leven bepalen 4 Machinaal leren algoritmen die uw leven bepalen U beseft het misschien niet, maar machinaal leren is al overal om u heen, en het kan een verrassende mate van invloed uitoefenen op je leven. Geloof me niet? Je zult verrast zijn. Lees meer over de relaties tussen kenmerken van videoframes en sleutelwoorden die beschrijven welke video-inhoud bestaat. Het video-hostingsysteem ontvangt een gelabelde trainingsgegevensset die een reeks media-items (bijv. Afbeeldingen of audioclips) omvat, samen met één of meer sleutelwoorden die de inhoud van de media-items beschrijven. Het video-hostingsysteem haalt functies uit die de inhoud van de media-items kenmerken. Een machine-geleerd model is getraind om correlaties te leren tussen bepaalde kenmerken en de sleutelwoorden die de inhoud beschrijven. De video-index wordt vervolgens gegenereerd die frames van video's in een videodatabase toewijst aan sleutelwoorden op basis van de kenmerken van de video's en het machine-geleerde model.”
Dat is een heleboel heel dichte dingen, maar hier komt het uiteindelijk op neer. Er wordt een algoritme voor het aanleren van apparaten gemaakt en Google helpt het te leren door een aantal video's te tonen en trefwoorden te geven om aan te geven wat er in de video staat. Het algoritme begint specifieke kenmerken van de video's te leren koppelen aan specifieke zoekwoorden en krijgt feedback van de ingenieurs van Google. Hoe meer video's en trefwoorden het krijgt, hoe beter het wordt bij het proces.
Uiteindelijk zal het algoritme worden geïntroduceerd in de YouTube-zoekmachine, waar het zal blijven leren en beter zal worden in het uitkiezen van relevante zoekwoorden uit audio- en video-inhoud. Hoewel de octrooiaanvraag niet specifiek neurale netwerken noemt De nieuwste computertechnologie moet je de nieuwste computertechnologie aanschouwen die je moet geloven. Bekijk enkele van de nieuwste computertechnologieën die zijn ingesteld om de wereld van elektronica en pc's te transformeren. in de komende jaren. Meer lezen, het is zeer waarschijnlijk dat dit specifieke type machine-leren zal worden gebruikt, omdat het erg goed is voor geënsceneerd leren als dit.
Door het menselijke brein te simuleren (of ten minste één theoretisch model van hoe het leert), kunnen grote neurale netwerken zeer effectief worden in het zelfstandig leren, zonder toezicht, en YouTube zou een absoluut gigantische speeltuin bieden waarin het feedback zou kunnen leren en ontvangen. . Andere soorten machine learning zouden kunnen worden gebruikt, maar van wat we op dit moment weten, zien neurale netwerken er zeker het meest aan.
Google-onderzoeker (en “vader van deep learning”) Geoffrey Hinton liet eerder dit jaar in zijn Reddit AMA iets over dit effect horen.
“Ik denk dat de meest opwindende gebieden in de komende vijf jaar echt inzicht in video's en tekst zullen zijn. Ik zal teleurgesteld zijn als we over vijf jaar niets hebben dat een YouTube-filmpje kan bekijken en een verhaal kan vertellen over wat er is gebeurd.”
Zal het Sentience verkrijgen en ons allemaal doden?
Dit is altijd de vraag die naar boven komt wanneer een nieuwe aankondiging over machine learning het nieuws raakt. En het antwoord is, zoals altijd, ja Hier is waarom wetenschappers denken dat je je zorgen moet maken over kunstmatige intelligentie Hier is waarom wetenschappers denken dat je je zorgen moet maken over kunstmatige intelligentie Denk je dat kunstmatige intelligentie gevaarlijk is? Kan AI een ernstig risico vormen voor de mensheid. Dit zijn enkele redenen waarom u zich misschien zorgen wilt maken. Lees verder . YouTube gaat samenwerken met Watson en Wolfram Alpha om ons onder de indruk te maken van YouTube-video's, waarna ze ons waarschijnlijk in computervoeding zullen veranderen. (Heb je het niet gezien? Kolos?)
Ik grap natuurlijk. Maar de mogelijke implicaties van het trainen van computers om dingen te herkennen die ze zijn “zien” en “horen” in video's zijn zeer indrukwekkend. DARPA is al op zoek gegaan naar You Will not Believe It: DARPA Toekomstig onderzoek naar geavanceerde computers Je gelooft het niet: DARPA Toekomstig onderzoek naar geavanceerde computers DARPA is een van de meest fascinerende en geheimzinnige delen van de Amerikaanse overheid. De volgende zijn enkele van de meest geavanceerde projecten van DARPA die beloven de technologische wereld te transformeren. Lees meer over de beveiligingsimplicaties van deze technologie, maar het is niet moeilijk je voor te stellen dat het wordt gebruikt in de wetgeving, binnenlandse veiligheid, onderwijs ... vrijwel overal.
Of de relevantie-gebaseerde beeldselectie van Google even effectief zal zijn als we ons voorstellen, valt nog te bezien, maar dit zou een mogelijk baanbrekende verandering in het zoeken naar video's kunnen zijn. En vanaf daar, wie weet? Als Google waarheid als een rangordefactor kan gebruiken Kan Google een algoritme gebruiken om de waarheid te bepalen? Kan Google een algoritme gebruiken om de waarheid te bepalen? Google onderzoekt of het algoritme de waarheid als een rangordefactor kan bevatten. Wat betekent dat voor het web? Meer lezen, er is geen reden om aan te nemen dat deze technologie niet verbazingwekkend krachtig zal zijn. Het kan veranderen hoezeer internet zichzelf ook echt begrijpt. Als die gedachte je niet in de knoop brengt, weet ik niet wat het zal doen.
Wat vindt u van de octrooiaanvraag van Google? Welk ander gebruik kun je je voorstellen dat deze technologie heeft? Deel je gedachten hieronder!
Afbeeldingen credits: Willyam Bradberry via Shutterstock.com, Ciumac Sergiu via Code42, Marko Bradic via Shutterstock.com.
Meer informatie over: kunstmatige intelligentie, Google Zoeken, video zoeken, YouTube.