Apple iOSInvestigación y DesarrolloUso de SmartphonesWireless

Vlingo y Nuance esperan que Siri los haga ver “cool”

Todos quedamos asombrados con el lanzamiento de Siri, Si bien el reconocimiento de comandos por voz no es nuevo  en los smartphones, ya que se usa en Android,  Blackberry y desde hace mucho tiempo atrás en Symbian, en Windows Mobile y en algunos de los últimos  modelos de Palm;, por ahora  el que parece ganar la batalla es precisamente este sistema avanzado que nos ha mostrado Apple.

Apple tiene tiempo trabajando en esta tecnología y sus antecedentes se remontan desde las betas de ios 5 y de hecho, el nombre del servicio es el mismo que el de la empresa que compro hace algunos años, propiedad de Nuance, por lo que como les decía en el post de la compra de Swype, tiene que ver con este desarrollo. Claro que ahora presenta una evolución mayor, enorme.. porque en ese entonces solo hacía búsquedas por internet empleando comandos de voz.

Lo curioso es que esto no es una idea nueva, ya que históricamente según comentan en 9to5 , fue en 2003, cuando el  gobierno de Estados Unidos comenzó un programa de inteligencia artificial que denominó “Asistente cognitivo que aprende y organiza” o programa CALO, financiado por DARPA como parte de su proyecto “asistente personal que aprende”, con el objetivo de construir una nueva generación de asistentes cognitivos que puedan razonar, aprender , recibir y ejecutar  órdenes,  explicar lo que están haciendo, reflexionar sobre su experiencia, y responder. Este proyecto estuvo vigente  hasta  finales de 2007 cuando la empresa SRI lo retomó y lo convirtió en Siri.

Esto tal vez significa que la idea la ha retomado Apple y no lo podemos descartar por completo. Lo más interesante o escalofriante para algunos, es que veremos una oleada de  Asistentes Personales Digitales futuros (APD o en inglés VPAs),   que en palabras de uno de los fundadores de Siri, Norman Winarsk, éstos representan el paradigma de interacción de siguiente generación para Internet  que permitirán que  interactuamos en una conversación diciéndole  lo que se quiere hacer, aplicándolo en múltiples servicios y fuentes de información para cumplir su tarea para lo cual empleará nuestra información personal, aprendiendo nuestras preferencias y revisando nuestro  historial  para resolver tareas específicas, para desempeñarse mejor a futuro.

GigaOM se cuestiona si Siri llegará a ser usado como el próximo Facetime pero con voz, respecto a que a pesar de ser alabado, no es tan usado o si será más como la App Store o las pantallas tactiles que nos proporcionan nuevas  formas de interactuar con nuestros dispositivos. Los partidarios de los programas de reconocimiento de voz y del mercado de los Asistentes Personales Digitales esperan que ocurra lo segundo. Los ejecutivos de las empresas Vlingo y Nuance  tendrán que analizar cómo el mercado reaccionará a los movimientos de Apple  (o mas bien del iphone 4S) y lo que significará para la industria porque definitivamente su futuro está relacionado con la aceptación de este servicio que los ayudará a crecer… o no.

Vlingo, la empresa pequeña

Vlingo,  es una empresa que tiene un producto  que presentó este año llamado Vlingo Virtual Assistant  y que al ver ls integración de Siri en el Pphone 4S, decidió lanzar gratuitamente su app . Así algunas tareas como revisar el clima o preguntar los restaurantes cercanos eran gratuitas, pero otras como dictar correos electrónicos o textos no lo eran y Siri hace todo esto y más  gratuitamente. Considerando que 4 de los 10 millones de usuarios  de Vlingo usan ios, tiene mucho por perder al ofrecer servicios que Apple ya está otorgando gratis.

Y aunque parezca malo, el CEO  de Vlingo Dave Grannan  no lo ve así, ya que considera que hay un mercado significativo para los asistentes virtuales  ya que desde su punto de vista, cuando Apple  hace algo es un aspecto que hay que considerar y  señal de que se va a expandir y eso es bueno para su negocio. Esto les pasó cuando Google anunció los comandos de voz para Android, con lo cual  Vlingo ganó usuarios, pero aún así, tomará  sus precauciones. A Grannan le preocupa que Apple haya ido demasiado lejos con la interfaz de lenguaje y los usuarios  terminen platicando muy coloquialmente con el producto y éste no les pueda responder. Considera que un asistente virtual debe ofrecer dos cosas: un fácil y otra difícil. La fácil debe ser la tecnología  de reconocimiento de voz y la difícil  es agregar contexto a las palabras  dichas  y  que se interprete lo que el usuario desea. Eso requiere de una máquina semántica e inteligencia artificial que esté continuamente mejorando pero no es perfecta.

Concluye mencionando que si no se guía a los usuarios a poner ciertas restricciones para el procesamiento del lenguaje natural, habrá problemas. Por eso ellos prefieren no llegar al extremo del uso de un lenguaje natural en sus usuarios, pero eso será un punto de equilibrio donde Apple tendrá que orientar sus usuarios.

Nuance, el pez grande

Mientras tanto, Nuance,  que es un proveeedor mucho más grande en cuanto a los programas de reconocimiento de voz y de los asistentes virtuales, está muy optimista con la influencia potencial de Apple  en la extensa adopción de  voz como una interfaz  en los móviles y otros productos de consumo. Mike Thompson de la división móvil de  Nuance, dice que la empresa tiene actualmente más de 100 millones de solicitudes de transacciones de reconocimiento de voz de su servicio y cree que Apple  mostró como el  habla puede ser una interfaz importante en los móviles y en los dispositivos de consumo masivo.

Nuance  cuenta con  Apple  como cliente de su software  y ya ha trabajado con Siri en el pasado cuando era una empresa independiente  pero no  mencionaron como  es dicha relación actualmente ( de hecho si buscas la empresa Siri  te lleva a la página de Apple de este servicio). Lo que mencionó es que cuando Apple aprueba y diseña algo,el resto del mundo lo sigue y  ellos esperan  que esto traiga mucha innovación en el desarrollo de un lenguaje natural de forma más profunda  donde el teléfono responda casi mágicamente.

Esta magia surge a costa del entendimiento de las palabras por el procesamiento del contexto y la conexión con la red. Siri requerirá una conexión a internet no solo para entender el diálogo, sino también para saber los pasos a seguir una vez que reconozca lo que se la ha dicho.  Decirle a Siri que le comunique a tu esposa que vas a llegar tarde o que te ayudea a encontrar un restaurante  vegetariano en una ciudad determinada, requiere  ancho de banda, y esto no es  difícil,  pero esto no significa que  al quedarte solo y sin datos, Siri vaya a conversar contigo.

Artículos relacionados

Un comentario

Back to top button