Zamknij reklame

Apple na swoim blogu Machine Learning Journal opublikowany nowy artykuł opisujący kilka ciekawych rzeczy na temat rozpoznawania głosu i korzystania z Siri na głośniku HomePod. Chodzi przede wszystkim o to, jak HomePod jest w stanie wychwytywać polecenia głosowe użytkownika nawet w trudnych warunkach pracy, takich jak bardzo głośne odtwarzanie muzyki, wysoki poziom hałasu otoczenia czy duża odległość użytkownika od głośnika.

Głośnik HomePod ze względu na swój charakter i skupienie musi być w stanie pracować w różnych warunkach. Niektórzy użytkownicy stawiają go na szafce nocnej obok łóżka, inni „sprzątają” go w rogu salonu lub umieszczają głośnik pod głośno grającym telewizorem. Scenariuszy i możliwości jest naprawdę wiele i inżynierowie Apple musieli pomyśleć o nich wszystkich, projektując technologię, która sprawi, że HomePod „słyszy” niemal w każdej sytuacji.

Aby HomePod mógł rejestrować polecenia głosowe w niezbyt sprzyjającym otoczeniu, posiada bardzo skomplikowany system odbioru i przetwarzania sygnałów dźwiękowych. Proces analizy sygnału wejściowego składa się z kilku poziomów oraz mechanizmu działającego w oparciu o samouczące się algorytmy, które potrafią odpowiednio filtrować i analizować przychodzący sygnał dźwiękowy, tak aby HomePod odbierał tylko to, czego potrzebował.

Poszczególne poziomy przetwarzania usuwają w ten sposób na przykład echo z odbieranego dźwięku, które pojawia się w odbieranym sygnale w wyniku produkcji HomePoda jako takiego. Inni zajmą się hałasem, którego w warunkach domowych jest za dużo – włączone kuchenka mikrofalowa, odkurzacz lub na przykład odtwarzający telewizor. I ostatnia o echu wynikającym z układu pomieszczenia i pozycji, z której użytkownik wypowiada poszczególne polecenia.

Apple omawia powyższe szczegółowo w oryginalnym artykule. Podczas opracowywania HomePod był testowany w wielu różnych warunkach i sytuacjach, aby inżynierowie mogli symulować jak najwięcej scenariuszy, w których głośnik będzie używany. Dodatkowo za wielokanałowy system przetwarzania dźwięku odpowiada stosunkowo mocny procesor A8, który jest cały czas włączony i stale „nasłuchuje” i czeka na polecenie. Dzięki stosunkowo skomplikowanym obliczeniom i stosunkowo przyzwoitej mocy obliczeniowej HomePod może pracować niemal w każdych warunkach. Niestety, szkoda, że ​​high-endowy sprzęt wstrzymuje stosunkowo niedoskonałe oprogramowanie (gdziekolwiek to już słyszeliśmy...), bo asystent Siri z roku na rok odstaje od swoich największych konkurentów.

HomePod fb
.