16 kwietnia 2018, Wojciech Kulik

Google wie kto mówi i wie co mówi

Kategoria: Ciekawostki Nauka, Tematyka: Google sztuczna inteligencja, Producenci: Google

Naukowcy z Google opracowali program oparty na sztucznej inteligencji, który potrafi zidentyfikować i wyodrębnić głos spośród innych. Wyniki są naprawdę imponujące, a równocześnie całkiem przerażające.

Przyjęcie, na którym każdy kogoś zna, jeden wielki chaos na dworcu kolejowym czy burzliwa debata na tematy światopoglądowe. Są sytuacje i miejsca, w których ilość dźwięków jest tak duża, że prawie niemożliwe jest wyizolowanie czyjegoś głosu (i skupienie się tylko na nim), a co dopiero zrozumienie, co ten ktoś ma do przekazania. …Chyba że jest się sztuczną inteligencją od Google.

Podczas gdy dla człowieka (dla którego głos jest naturalnym nośnikiem komunikacyjnym) rozróżnianie dźwięków jest trudne, dla maszyny czy programu było do tej pory praktycznie nieosiągalne. O tym większym sukcesie może więc mówić firma Google, która zdołała nauczyć swój twór zwracania uwagi na pewne elementy wypowiedzi, dzięki czemu potrafi on całkowicie wyizolować tło (wraz z innymi osobami).

O co chodzi? Spójrzcie na ten materiał:

Albo ten:

Jak widać, system stworzony przez Google radzi sobie wyśmienicie identyfikacją i wyodrębnieniem danego mówcy oraz wyciszeniem wszystkiego, co nie jest jego głosem. W taki sam sposób można pozbyć się wszelkiego rodzaju szumów z otoczenia – tak jak na tym filmie:

Jak osiągnięty został tak wyśmienity efekt? Naukowcy wykorzystali dość nietypową, ale genialną metodę szkolenia SI. Opiera ona swoje działanie nie tylko na dźwięku, ale też obrazie (starając się odkryć źródła pochodzenia danych głosów, analizując na przykład mimikę mówcy). 

Google SI głos

Oczywiście w zależności od rozmiaru różnic w głosach poszczególnych osób, rezultat może być lepszy lub gorszy, ale i tak jest to imponujące… i przerażające zarazem. Nie trzeba być miłośnikiem teorii spiskowych, by wymyślić choćby kilka (niekoniecznie pozytywnych) zastosowań dla tego rozwiązania.

Źródło: Google Research Blog, Android Police. Ilustracja: geralt/Pixabay (CC0)

Komentarze

  • Kenjiro, #

    Nie rozumiem przerażenia, przecież zastosowane podejście jest bardzo logiczne i wymaga po prostu odpowiedniej technologii, więc dla mnie było oczywistym, że się pojawi. Jedyną zagadką było - kiedy.

  • Skaza, #


    Wydaje mi się, że pytanie nie powinno dotyczyć czasu pojawienia się takiej technologii, a jej przeznaczenia. Można również zapytać, dlaczego niektóre aplikacje z Google Play żądają dostępu do mikrofonu, aparatu i wielu innych elementów, choć ich funkcjonalność nie jest w żaden sposób z tymi elementami związana.

  • mesjan, #

    Wyszukiwarka googla wykorzystuje mikrofon do wyszukiwania głosowego, tłumacz googla wykorzystuje aparat do tłumaczenia tekstu na ekranie najeżdżając kamerą na tekst. Tworząc aplikację na telefon która choćby muśnie jakiegoś czujnika który nie został wymieniony w regulaminie może zakończyć się sprawą w sądzie i wysokim odszkodowaniem.

  • owatanka, #

    Jak na moje to za****ste wyczuj to tesciowa ci prawi farmazony nad uchem a ty wyciszasz jej skrzeczenie i spokojnie ogladasz sport :O

  • sebastianzola, #

    A ja rozumiem przerażenie. Dzięki temu można podsłuchiwać co mówi dana osobą w tłumie, na imprezie. Oczywiście zależy do czego będzie to wykorzystane ale patrz zawsze w dwie strony.

  • Chiny_X, #

    Przecież telefon już od dawna podsłuchuje użytkownika.
    Zrobiliśmy eksperyment z żoną i przy zablokowanych zaczęliśmy nagminnie rozmawiać o jodze przez cały dzień.
    Dwa dni później na pewnym portalu udostępniającym treści video którego aplikacje mieliśmy zainstalowane w sugestiach mnóstwo filmików tematycznych.
    Więc żadna to nowość.

  • michalje, #

    dla ignorantów to jest nowość, albo coś co mają po prostu gdzieś. ~90% społeczeństwa uważa, że i tak nie ma nic do ukrycia więc im to rybka.. ehh

    Każdy taki ignorant zmienia podejście, gdy pytam go czy miałby coś przeciwko, żebym zamontował w jego domu kamerkę i sobie oglądał co robi (w końcu nie ma nic do ukrycia). Ale kamerka w laptopie takiemu nie przeszkadza i dziwi go po co zaklejam taśmą swoja. Ludzie to debile

Dodaj komentarz

Dodawanie komentarzy tylko w wersji dla PC. Już wkrótce wersja mobilna.

Nie przegap

Szanowny Czytelniku.

Aby dalej móc dostarczać Ci materiały redakcyjne i udostępniać nasze usługi, pozostając w zgodzie z zasadami RODO, potrzebujemy również zgody na ewentualne dopasowywanie treści marketingowych do Twojego zachowania. Dbamy o Twoją prywatność. Nie zwiększamy zakresu naszych uprawnień. Twoje dane są u nas bezpieczne, a zgodę możesz wycofać w każdej chwili na podstronie polityka prywatności. Dowiedz się więcej.