Wyszukiwanie głosowe

Ikona wyszukiwania głosowego Google
Ikona wyszukiwania głosowego Google

Wyszukiwanie głosowe – narzędzie, które pozwala użytkownikowi na użycie polecenia głosowego do przeszukiwania Internetu lub urządzenia. Technologia ta ma zastosowanie na urządzeniach mobilnych oraz komputerach.

Historia

Implementacja Google

Wyszukiwanie głosowe jako narzędzie od Google pozwala użytkownikowi na wykorzystanie mikrofonu w telefonie do tworzenia zapytań w wyszukiwarce. Początkowo, aby uruchomić narzędzie należało wpisać numer (650) 623-6706, następnie użytkownik oczekiwał na słowa „Wypowiedz swoje kluczowe słowa” (ang. Say your Search Keywords), po usłyszeniu których mógł wypowiedzieć frazę, którą chciał znaleźć. Narzędzie aktualizowało stronę lub generowało link do strony wyszukiwania z zapytaniem użytkownika. Od kiedy Google zaczęło używać technologii rozpoznawania mowy takich jak GOOG-411(ang.), wersje z użyciem numeru telefonu zostały dezaktywowane.

Implementacja Apple

Firma Apple wprowadziła w Lutym 2010 roku swoje rozwiązanie wyszukiwania głosowego wydając aplikacje,o nazwie Siri[1], na urządzenia z systemem iOS. Oprogramowanie opiera się na interfejsie konwersacyjnym – rozpoznaje naturalną mowę użytkownika, odpowiada na jego pytania oraz wykonuje powierzone mu zadania. Dzięki zastosowaniu nauczania maszynowego asystent analizuje osobiste preferencje użytkownika, dzięki czemu zapewnienia bardziej dopasowane wyniki. Siri zadebiutowała wraz z systemem operacyjnym iOS 5, 4 października 2011 roku podczas konferencji „Let’s Talk iPhone”.

Zastosowanie

Typowe zastosowania[2]:

  1. Wyszukiwanie haseł o trudnej pisowni
  2. Wyszukiwanie dłuższych haseł
  3. Hasła, które wygodniej jest wyszukać na głos
  4. Wyszukiwanie bez pisania

Wspierane języki

Języki znajdujące się na liście są aktualnie w całości lub częściowo wspierane przez narzędzie wyszukiwania głosowego.

JęzykRok wprowadzenia
Afrikaans2010
Amharski2017
Armeński2017
Azerski2017
Baskijski2012
Bengalski2017
Bułgarski2012
Kataloński2012
Czeski2010
Duński2014
Niderlandzki2010
Angielski2008
Filipiński2013
Fiński2012
Francuski2010
Galicyjski2012
Gruziński2017
Niemiecki2010
Gudźarati2017
Hebrajski2011
Węgierski2012
Islandzki2012
Włoski2010
Indonezyjski2011
Japoński2009
Jawajski2017
Kanadyjski2017
Koreański2010
Khmerski2017
Laotański2017
Łacina2017
Łotewski2017
Litewski2015
Mandaryński2009
Malajski2011
Malajalam2017
Marathi2017
Nepalski2017
Norweski2012
Perski2013
Polski2010
Portugalski2012
Rumuński2012
Rosyjski2010
Serbski2012
Syngaleski2017
Słowacki2012
Hiszpański2010
Sundajski2017
Suahili2017
Szwedzki2012
Tamilski2017
Telugu2017
Turecki2010
Urdu2017
Zulu2010
Wietnamski2015

Implementacja wyszukiwania głosowego we własnej aplikacji

Google pozwala na użycie wyszukiwania głosowego we własnej aplikacji udostępniając API swojej aplikacji[3]. W przypadku Google Voice Search jest to Web Speech API. Implementacja wygląda następująco[4]:

<div>
 <a href="#" id="start_button" onclick="startDictation(event)">Dictate</a>
</div>

<div id="results">
 <span id="final_span" class="final"></span>
 <span id="interim_span" class="interim"></span>
</div>

<script type="text/javascript">
var final_transcript = '';
var recognizing = false;

if ('webkitSpeechRecognition' in window) {

 var recognition = new webkitSpeechRecognition();

 recognition.continuous = true;
 recognition.interimResults = true;

 recognition.onstart = function() {
 recognizing = true;
 };

 recognition.onerror = function(event) {
 console.log(event.error);
 };

 recognition.onend = function() {
 recognizing = false;
 };

 recognition.onresult = function(event) {
 var interim_transcript = '';
 for (var i = event.resultIndex; i < event.results.length; ++i) {
 if (event.results[i].isFinal) {
 final_transcript += event.results[i][0].transcript;
 } else {
 interim_transcript += event.results[i][0].transcript;
 }
 }
 final_transcript = capitalize(final_transcript);
 final_span.innerHTML = linebreak(final_transcript);
 interim_span.innerHTML = linebreak(interim_transcript);

 };
}

var two_line = /\n\n/g;
var one_line = /\n/g;
function linebreak(s) {
 return s.replace(two_line, '<p></p>').replace(one_line, '<br />');
}

function capitalize(s) {
 return s.replace(s.substr(0,1), function(m) { return m.toUpperCase(); });
}

function startDictation(event) {
 if (recognizing) {
 recognition.stop();
 return;
 }
 final_transcript = '';
 recognition.lang = 'en-US';
 recognition.start();
 final_span.innerHTML = '';
 interim_span.innerHTML = '';
}
</script>

Przypisy

  1. Siri: Your Personal Assistant for the Mobile Web – ReadWrite, „ReadWrite”, 4 lutego 2010 [dostęp 2018-02-11] (ang.).
  2. Wyszukiwanie głosowe – Wszystko o wyszukiwaniu – Google, www.google.com [dostęp 2018-02-06] (pol.).
  3. How to Add Speech Recognition to your Website with HTML, www.labnol.org [dostęp 2018-02-11] (ang.).
  4. How to Use the Web Speech API in HTML5, „Web Geek”, 9 marca 2014 [dostęp 2018-02-11] (ang.).

Linki zewnętrzne

Media użyte na tej stronie

Google 2015 logo.svg
Google logo since September 1, 2015. The letters of "Google" are each purely colored (from left to right) with blue, red, yellow, blue, green, and red in Product Sans font. The e is slightly angled.
Google mic.svg
Google mic