Interfejs 3.0. - zabójca klawiatur nadchodzi. Bardzo powoli.
 Oceń wpis
   
logo SpinVoxPomysł jest genialny i genialnie prosty. Oraz znany od dawna. A nawet realizowany.

To naprawdę proste:
Wyobraź sobie, że mówisz, a to co mówisz zapisuje się w edytorze tekstu.
To naturalny sposób komunikacji - zresztą porównaj ten tekst z czytanym. Mowa jest lepsza niż pismo.

Próbował to robić MS Word 2003, Office 2007 przyznaje w swojej pomocy, że nie potrafi i żeby próbować ze starszą wersją.
Vista podobno potrafi, ale nie po polsku a ja mam polską Vistę i nie mogłem sprawdzić.
Jest jednak takie narzędzie Dragon Naturally Speaking i ono działa. Po angielsku. Trudno się zresztą spodziewać, że cokolwiek zacznie rozpoznawać co mówimy po polsku, w końcu i tak wszyscy będziemy porozumiewać się Galak... Biznesowym Angielskim.

Mimo wszystko ten Dragon nie jest idealny, bo trzeba gadać do komputera, który jak wiadomo nie zawsze jest włączony obok.
Dlatego SpinVox to jest pomysł genialny i rewolucyjny. Otóż do SpinVoxa dzwoni się przez telefon i mówi, on to magicznie konwertuje na tekst a my sobie potem znajdujemy ten tekst na stronie www pięknie napisany. Oczywiście do SpinVoxa można zadzwonić na numer w USA albo w Wielkiej Brytanii. I oczywiście do niego też trzeba mówić po angielsku.
Mimo to, uznałbym to narzędzie za ideał (w końcu od czego jest skype).

Niestety SpinVox tak samo rozumie co mu mówimy jak stary MS Word. Mark "Rizzn" Hopkins z Mashable! ucieszył się ze SpinVoxa bardziej niż ja (na szczęście nie prowadzę tak jak on zarazem radia i bloga) i wnet go sprawdził:

 

Raport Rizzn'a:

What I said: “Ok, well, let’s see… What am I talking about? Oh! Actually I put a new article up on Mashable.com today. ”
What I said, SpinVoxed: “Ok well, see what I’m talking about oh actually put a new article of nashville.com(?) today.”

What I said: “It’s that YouTube or whatever may have helped them get there quicker, citing the new Apple UGC ad that came out as an example.”
What I Said, SpinVoxed: “It’s that a youtube or whatever may have helped them get their quick or setting the new apple UGC ad,…”

What I said: “It’s staying on and letting me talk and so I’m just gonna talk until this thing kicks me off.”
What I said, SpinVoxed: “It’s sticking on let me talk and so I’m just gonna talk into this thing puts me off.”

 

Przypomniało mi się jak próbowałem Worda2003 nauczyć rozpoznawania mowy - to wyglądało tak samo.

Mimo wszystko SpinVox to przyszłość. Przyszłość sieci to urządzenia mobilne i naturalny interfejs komunikacji. Czyli mowa i ruch.
Nie klawiatura. Nie machanie myszką. Nie rysik. Nie stukanie w szybkę.
Interfejs 3.0 to właśnie coś co pozwoli nam z dowolnego miejsca POWIEDZIEĆ to co chcemy i ZAPISAĆ to w Sieci. SpinVox to krok w tym kierunku. Tylko dlaczego taki mały?
Komentarze (13)
Leopard już jutro także w... Nie warto blogować, zamknijmy...

Komentarze

2007-10-29 01:25:51 | 195.34.211.* | Tomasz Topa
Re: Interfejs 3.0. - zabójca klawiatur nadchodzi. Bardzo powoli. [2]
Ja czekam na coś, co pozwoli mi przelewać myśli na ekran bezpośrednio, bez
konieczności zamieniania tego najpierw na głos :) Mniej konwersji (myśl -> głos ->
napis), lepsza jakość :) skomentuj
2007-10-29 03:55:47 | 84.40.222.* | Marek Małachowski
A tak na prawdę, to po co to? Dzwonie, dyktuję wiadomość, serwer ją tłumaczy na tekst
pisany i publikuje. Następnie ktoś inny może sobie to odczytać. Czy nie prościej i
skuteczniej w efekcie jest ""dzwonię, dyktuje, a ktoś pobiera podcasta i
odsłuchuje?"...

Bo dochodzimy do zestawienia interakcji ze światem w formie "mówienie i czytanie", a
nie "pisanie i słuchanie".... i nie wiem czy to jest uzasadnione... skomentuj
2007-10-29 09:33:55 | 217.153.72.* | paru
Re: Interfejs 3.0. - zabójca klawiatur nadchodzi. Bardzo powoli. [8]
A jesteś sobie w stanie wyobrazić 8 programistów w jednym pomieszczeniu, z których
każdy oprócz zwyczajowego "k.... ale ze mnie kretyn", dodatkowo pokrzykuje na
komputer mówiąc, żeby przesunął kursor o dwie linijki wyżej? Moim zdaniem takie
rozwiązanie jest
1. W bardzo wielu przypadkach wolniejsze niż myszka+klawiatura
2. Czesto problematyczne ze wzgledow bezpieczeństwa/prywatnosci
3. Uciazliwie, gdy w pomieszczeniu pracuje wiecej niz jedna osoba

Podsumowujac - byc moze klawiatura i mysz zostana czyms zastapione, ale interfejs
glosowy to chyba nie jest wlasciwe rozwiazanie skomentuj
2007-10-29 09:54:19 | *.*.*.* | pwrzosin
Myślę, że już niedługo nie będzie sensu zbierania programistów w jednym miejscu. Sieć
jest już prawie wszędzie, a urządzenia mobilne nie są słabsze od stacjonarnych. Ale
efektywna praca interfejsem głosowym jest możliwa także w zespołach - popatrz na call
centre chociażby. skomentuj
2007-10-29 09:56:02 | *.*.*.* | pwrzosin
W drugą stronę już mamy interfejs. Konwersja tekstu na mowę to coraz mniejszy
problem. :) skomentuj
2007-10-29 10:02:52 | 217.153.72.* | paru
Coz - ja mysle, ze pewnie z 50% programistow bedzie jednak nadal pracowac w
siedzibach swoich firm. Wbrew pozorom ma to bardzo duzo zalet.
Praca w call center ma sie jednak nijak do pracy programisty. BTW - byles kiedys
kiedys w call center? Moim zdaniem przebywanie w pomieszczeniu, w którym przy pomocy
interfejsu glosowego jednoczesnie pracuje duza liczba osob, moze w krotkim czasie
doprowadzic do obledu. skomentuj
2007-10-29 10:38:31 | *.*.*.* | pwrzosin
Nawet pracowałem w call center jako żuczek przy słuchawce. Nie jest wcale tak źle. A
telepraca jest naprawdę przyszłością - opłaca się wszystkim. Tańsze biuro, brak
kosztów dojazdu, więcej czasu dla siebie. Zalety w postaci kawy i lunchu tez da sie
zastąpić. A nowa sieć pozwala na spotkania prawie realne - IBM z powodzeniem testuje
konferencje w Second Life :) skomentuj
2007-10-29 14:16:25 | 194.149.228.* | radek g
Re: Interfejs 3.0. - zabójca klawiatur nadchodzi. Bardzo powoli. [0]
Ja pierwszy raz o SpinVox usłyszałem razem z Truemors Kawasakiego. Była opcja aby
zadzwonić na specjalny numer i dodać głosowo swoją plotkę. Serwis się nie przyjął,
ale dał pomysł na jedno z zastosowań tego rozpoznawacza mowy. skomentuj
2007-10-29 19:10:00 | 83.7.140.* | gszczepa
Telepraca ma sporo wad i im bardziej się rozpowszechnia tym więcej jej wad widać:,
np

1) utrudnia oddzielenie życia prywatnego od zawodowego; dlatego powstał trend
wspólnego wynajmowania biura przez niezależnie pracujących telepracowników;

2) obniża poziom bezpieczeństwa - o ile pomieszczenia firmy można całkiem skutecznie
zabezpieczyć przed fizycznym wtargnięciem to w przypadku pracy w domu jest
praktycznie niemożliwe, skomentuj
2007-10-30 00:26:37 | *.*.*.* | maw
może inaczej - "zwykli" użytkownicy będą patrzeć na nas - na programistów jak na
dziwnych ludzi, którzy nie umieją się posługiwać "MS voice Media" tylko będą
potrzebowali czegoś takiego, co się "klawiatura" nazywa - będzie to bardzo egzotyczne
i bardzo drogie urządzenie dla wybranych :)

myślę, że nawet grafikom komendy głosowe jak najbardziej przypadną do gustu...

PS. Zastanawia mnie jedno: jak komputer odróżni: "morze było zbyt głębiokie" od "{on}
może płynie zbyt daleko" ? skomentuj
2007-10-30 00:40:39 | *.*.*.* | pwrzosin
Grzegorz, ty żyjesz? :)
Tak poziom bezpieczeństwa jest tu pewnym problemem, ale pracuje się nad tym - są
sprzętowe zabezpieczenia szyfrujące dyski, biometryczna kontrola dostępu do danych
etc. To standardowe zabezpieczenia u wiodących producentów, na pewno są u Acera i
Lenovo. Przypuszczam, ze już każdy producent komputerów ma je w ofercie.
Niebezpieczeństwo jest jeszcze w przesyłaniu danych siecią, ale i to można rozwiązać
szyfrowaniem, VPN itd. itp.

Oddzielenie życia prywatnego i zawodowego - cóż wydaje się, że trudno je będzie
zachować w przyszłości. Mi się zlewa praca z życiem prywatnym na całego, czego
dowodem ten blog, jak by nie było związany z pracą. Ale tłumaczę to sobie pasją :) skomentuj
2007-10-30 10:21:03 | 217.153.72.* | paru
Zgadzam sie, ze istnieja pewne zastosowanie, gdzie interfejs glosowy moze byc
przydatny, ale wydaje mi sie ze to jednak glowne wstepne wprowadzanie dluzszych
tekstow. Edycja tekstu jest juz z cala pewnoscia wygodniejsza i SZYBSZA przy pomoc
klawiatury i myszy. Pokrzykiwanie na komputer by przesunął kursor jeszcze trzy
kolejne linie niżej prędzej doprowadzi do zdarcia gardła niż wykonania zadania.
Nie twierdzę, że nigdy nie zostaną opracowane jakies sprytne techniki pozwalające na
przyspieszenie tego typu prac, ale poki co, nawet jesli zostanie dopracowane samo
rozpoznawanie mowy, to cala masa pracy pozostanie przy dopieszczaniu takiego
interfejsu. skomentuj
2007-10-30 21:37:20 | 83.7.129.* | gszczepa
Żyję :) skomentuj
Ankieta
Co stanie się z telewizorami?
Zostaną wyparte przez komputery PC
Przejmą funkcje komputerów PC
Razem z PC znikną z rynku
Będą się rozwijać niezależnie od komputerów
Nie mam zdania na ten temat
Mam inne zdanie (komentarz pod wpisem)
O mnie
Piotr Wrzosiński
Piotr Wrzosiński
Najnowsze wpisy
2011-10-03 10:41 W zeszłym tygodniu pod nowym adresem
2011-09-25 18:20 Minął kolejny tydzień
2011-09-19 11:07 Podsumowanie tygodnia
2011-09-12 13:37 Przedruk i przeprowadzka
2011-09-02 17:36 Wybierz swój e-book!
Najnowsze komentarze
2015-02-24 18:33
KamilDawid:
Minął kolejny tydzień
Mam nadzieje, że to nie będzie koniec bloga. Zapraszam
2014-10-08 04:36
Thank you:
Nie ukradliśmy tego HTC z Windows Mobile. Serio.
Thank you http://gamesfree4flash.blogspot.com/[...]
2014-10-08 04:34
Thank you:
Nie ukradliśmy tego HTC z Windows Mobile. Serio.
Thank you http://downloadgamesair.blogspot.com/[...]