La importancia de Siri, por Alf

Hal 9000Con la presentación del iPhone 4S ha hecho su aparición una característica exclusiva (aparte de las mejoras en la cámara de fotos) que diferencia este modelo de cualquier anterior, ya que ninguno heredará estas capacidades. Siri, el asistente de voz de iOS5 para el iPhone 4S es mucho más que la diversión con la que pasar un buen rato admirando a los amigos con las cosas que hace el teléfono. Es el principio de un nuevo interfaz, aún más revolucionario que utilizar los dedos para manejar un dispositivo. Siri es el principio de una era, esa que tantas veces hemos visto en las películas de ciencia ficción, en la que todo puede ser controlado mediante la voz.

Está claro que no sé si Siri evolucionará para cumplir las promesas que augura, o si se quedará como tantas cosas que ha presentado Apple, a medio cocinar y sin despegar nunca: ¿alguien sigue usando el reconocimiento de escritura que sólo se activa cuando conectas una tableta? ¿alguien se acuerda de las lecciones de artistas que explicaban cómo tocar sus canciones en GarageBand? tantos anuncios de “revoluciones” que luego se deshinchan en el olvido… Puede que Siri acabe en una de esas situaciones, nunca desarrollada del todo y superada por la “próxima” gran cosa (sea realidad aumentada, los mapas o cualquier otro conejo que se saquen de la chistera para el iPhone 5, 6 ó 14.

Sin embargo, cualquiera que pase un tiempo viendo los vídeos que ya pueblan la web de gente utilizando el asistente personal por voz, podrá percibir inmediatamente dos cosas:

– Lo asombroso de que entiende lo que se le dice, utilizando leguaje corriente

– Lo bruscamente que se alcanza el final de la conversación.

Es verdaderamente llamativo que se pueda “hablar” con el teléfono utilizando frases completas y que sea el teléfono el que se encargue de eliminar las partes sin significado e interpretar las que lo tienen. Si has utilizado el asistente de voz del iPhone, sabrás que ahora puedes decir una palabra (orden) y confiar que la entienda: Llamar (nombre), Reproducir (grupo/canción), ¿Qué hora es?,… un poco de ruido de fondo o una pronunciación diferente de la académica y entrarás en un diálogo de besugos desesperante: Llamar a Alf. Suena música de The Cors. Cancelar. Llamar a Alf, No suena música. Cancelar. Llamar a Alf, Llamando a Sara, móvil, casa, trabajo,… Cancelar.

No podemos obviar el gigantesco paso que es poder dirigirnos a un dispositivo (de momento teléfono móvil) con frases coloquiales y que éste sepa lo que queremos decir y pueda presentarnos un resultado que satisface nuestra petición. Es un salto de gigantes hacia la “normalización” de nuestra relación con las máquinas, hasta ahora sólo visto en películas del futuro.

La otra gran conclusión de estas interacciones es… lo rápido que se acaban. Ver los vídeos y desear que la conversación pudiera continuar es todo uno. Pedir el pronóstico del tiempo y que sólo nos muestre una imagen con la previsión es un tanto frustrante. Parece que debería “cantarnos” también la previsión del tiempo, de manera que le pudiéramos seguir hablando.

Features siri gallery saythingsPreguntarle por un restaurante en las cercanías y que nos muestre un listado con los diez o quince que ha encontrado para que seamos nosotros los que escojamos, es una forma poco cortés de acabar la conversación. debería darnos la opción de que nos leyera en voz alta los resultados y que nosotros pudiéramos decirle: “Ése. Llama para que haga la reserva”.

Pedirle a Siri que nos muestre cómo llegar a la plaza de nuestra ciudad y que se limite a mostrarnos un mapa, sin guiarnos con la voz (o sin preguntarnos si queremos que nos guíe) se queda como que se ignora lo evidente, la continuación natural.

Siri es un primer paso. Muy grande, y el más importante, pero sin duda quedan muchos por dar para que la interacción sea completa.

Decía en una columna anterior que me parece razonable pensar que en la próxima WWDC, para la que falta poco menos de un año, Apple presente una API que permita que las aplicaciones tomen el relevo del asistente y se puedan utilizar con la voz. Apple haría posible que se dieran órdenes de “Abre (nombre de la aplicación)” y a partir de ahí Siri nos guiaría para que pudiéramos utilizar las aplicaciones sin necesidad de mirar al teléfono.

Rutas (llévame al Monumento al soldado desconocido) , recetas (Dime qué necesito para hacer champiñones al jerez), guías de televisión (dime cuándo ponen el próximo episodio de House), programación de acciones (graba el próximo episodio de El Mentalista. Cuando pongan alguna película de Jack Nicholson grábala), lectura (léeme el editorial de El Pais de hoy) … las opciones son múltiples.

Por supuesto, los invidentes serían grandes fans de un interfaz así.

Porque la revolución de Siri, es que es un interfaz sin interfaz. Idealmente, ya no hace falta un dispositivo tangible. Siri escucha y responde. No hace falta que toques, que mires, o que sepas lo que quieres. Puedes empezar una conversación con Siri y será como pensar en voz alta. Por supuesto, la conversación girará alrededor de datos, fechas, cifras,… o recibirás el tipo de respuesta filosófico ambigua que te permita interpretarla en el sentido que tú desees.

Según hemos podido leer, Siri es la división en Apple que más ingenieros tiene trabajando en estos momentos, lo cual nos da una dimensión de la importancia que Apple ha dado a esta capacidad y lo titánico de la tarea que es pedirle a un teléfono que entienda el contexto conversacional de prácticamente todas las lenguas del “primer mundo” (el iPhone 4 se vende en alrededor de 100 países).

Que haya tantos ingenieros trabajando en Siri (más de mil, he leído) quiere decir que Apple ve mucho potencial en el desarrollo de Siri y que cree que puede convertirlo en una característica diferencial más allá del software (y por supuesto del hardware) en el tiempo. Siri es una capacidad que los competidores difícilmente van a poder copiar, y si lo hacen de una manera poco elegante o eficaz, sólo conseguirán aumentar la distancia entre ellos y Apple.

Por supuesto, sabemos que Siri no estará completo en español hasta 2012, por lo que estaremos limitados en el aprovechamiento. Además, la utilización de Mapas de Google para localizar ubicaciones por parte de empresas y negocios en España está en pañales comparado con los Estados Unidos, por lo que tampoco será sencillo que sea capaz de llevarnos a cualquier sitio que le digamos.

Asociaciones: Yelp y más allá.

Precisamente por eso, que Apple se haya asociado con Yelp (y Wolfram Alpha) para ofrecer los datos y recomendaciones de restaurantes tiene una importancia crucial.

Apple sabe que Mapas de Google es sólo una situación transitoria, hasta que la propia Apple publique su propia aplicación de mapas. Pero es que además, con Siri, hasta la propia concepción de “mostrar un mapa” queda obsoleta (relativamente). Una voz guiada por un GPS podrá decirnos en cada momento si tenemos que girar o si tenemos que seguir rectos.

La asociación con Yelp demuestra que Apple entiende que es vital para la eficacia que terceras empresas añadan contenidos, cuanto más diversos mejor, para que Siri cada vez sepa más de más cosas. Cada vez que se le hace una consulta a Siri, ésta lo traduce, lo envía a los servidores de Apple, realiza la búsqueda y devuelve los resultados (por eso Siri no funcionará en absoluto si no tienes conexión de datos). De ahí la importancia de limitar al máximo las fuentes en las que tiene que buscar, para que el retorno de soluciones sea lo más rápido -y natural- posible, manteniendo así el efecto conversacional.

Museos, monumentos, resúmenes de libros, historia,… piensa en un tema e imagínate todo indexado y preparado para que Siri acceda a ello y pueda enunciar resultados exactos. Las opciones son infinitas

Personalmente creo que un SDK abierto donde todos aquellos que lo consideren útil puedan aportar sus propios conocimientos y que sea donde Siri consulte los datos es algo que está todavía a bastantes años de distancia. Apple primero trabajará detectando carencias de “bulto” y buscando socios (como Yelp) y simultáneamente abrirá una API para que todas las aplicaciones (que sus desarrolladores quieran) puedan ser gestionadas a través de la voz.

Aún se plantea el conflicto (es de suponer que esta vez habrán previsto que no se repita el caso Lodsys -en el que Apple licencia unas patentes pero Lodsys considera que los desarrolladores que utilizan esas patentes a través de las herramientas que facilita Apple no están amparados por esa licencia) de aquellas aplicaciones que ya tienen interfaz de voz, como las de rutas (TomTom, Navigon, etc.). ¿Seguirán utilizando su propio interfaz o la voz de Siri tomará el control?

Licencias

Sea como sea, Apple ya ha experimentado con el iPod lo que es ampliar su nivel de influencia a base de licenciar las conexiones en coches, altavoces, etc. Del “Works with iPhone” o “Made for iPod” podríamos pasar al “Works with Siri” de manera que el control de todo tipo de aparatos se realizara a través de un sistema -y una voz- conocida.

Equipos de música, televisiones, lavadoras, vehículos, incluso puertas, aires acondicionados,… todo podría estar licenciado por Apple de manera que su sistema de inteligencia artificial pudiera controlar y entender lo que le dice el usuario.

(Lavadora) “Prepara un programa en frio”,

(Coche) “Recuérdame que eche gasolina antes de empezar a utilizar la reserva”, “Aparca”

“Avísame si supero el límite de velocidad de cada vía”

“Dime que pare en la primera área de servicio cuando lleve más de dos horas conduciendo”

(Televisión) “Cambia de canal”

(DVR) “Graba todos próximos episodios de Almacén 13”

(Casa) “Enciende la cafetera todos los días de diario a las siete de la mañana” “Que todas las luces y equipos estén apagados a las doce de la noche”

Además, todas esas licencias podrían estar conectadas a través de me.com, de manera que desde nuestro teléfono pudiéramos dar órdenes “a nuestra casa” desde cualquier parte del mundo.

Cada electrodoméstico conectado a internet a través de Siri (¿quién necesita interfaz?) lo estaría también a nuestra cuenta me.com, desde donde podría ser controlado, también vía Siri, a través de nuestro teléfono.

Por supuesto, todo esto puede acabar siendo ciencia ficción, tal y como llevamos viendo en las películas desde hace décadas, igual que es posible que todos acabemos vistiendo monos de color blanco en casas blancas con todo el mobiliario fabricado en plástico postformado…

Pero viendo Siri y las cosas que hace, creo que -por primera vez- he visto el futuro y cómo vamos a llegar a él.

Seguiremos informando.

0 0 votos
Article Rating
Subscribe
Notify of
7 Comments
Oldest
Newest Most Voted
Opiniones Inline
Ver todos los comentarios
mikeunimac
mikeunimac
12 years ago

Cuando probé las órdenes habladas de Mac OS 9 (en inglés) cerré el arranque del Mac al reconocimiento de mi voz, nadie más podía arrancarlo.

Y en mi despacho (cerrado) abría apps, cerraba ventanas, apps, ponía el Mac a dormir o le mandaba apagarse.

Cierto, mucho futuro, ahora bien, es un tema muy viejo.

Anónimo
Anónimo
12 years ago

ver una sala de juntas con 4 o mas personas con Siri activado, dando instrucciones, me imagino que si la sala es pequeña, será capaz de no responder a las preguntas/órdenes del que está sentado a mi lado, si ambos activamos al tiempo el micrófono…. o una competencia, a que mi Siri es mas rápida que la tuya….. jajajajaja

wenmusic
12 years ago

Las lecciones de artistas no, pero las normales de GarageBand (gratuitas además) están muy bien 😛

Siri tiene una pinta fantástica, una lástima que no lo saquen para iPhone 4. Entiendo que ellos están a ganar pasta, pero me apetecía probar este asistente.

gilbertmc
gilbertmc
12 years ago

El iPhone 4S se hace muy gustoso con Siri… No me importaría nada hablar en inglés (así aprovecho y practico).

Respecto a dar ordenes con Siri al resto de electrodomesticos… Ardo en deseos que esto pudiera cumplirse y encima desde cualquier parte del mundo!

Llegar a casa y encontrarte con la casa calentita en invierno habiendote olvidado de programarlo, que te avise cuando termine la lavadora, cuando la comida en horno o microondas esté lista, que haga falta comprar algo que falte en la nevera, que necesites hielo en medio de una fiesta y te avise cuando esté congelado. Y no seguiremos con ejemplos para el coche u otras cosas porque es ponernos los dientes largos.

Me vienen a la memoria tantas cosas que he visto en Futurama y otras peliculas…

Ay Alf, que Apple te oiga y licencie Siri!

Gilbert

SINNICK
SINNICK
12 years ago

Quizás con Siri estemos más cerca de implantar el ordenador vía subcutánea, como los “chips” caninos.
Si el periférico de visualización es nuestro propio ojo, o cerebro, habremos conseguido dos personas distintas y un solo humano verdadero.

Anónimo
Anónimo
12 years ago

ajajaj aaaai Gilbert… bueno todo eso ya podemos hacerlo, muchos electrodomésticos se pueden programar, existen neveras que indican cuando faltan alimentos… termostatos de calefaccón a los que les puedes enviar un sms para calentar la casa o bien programarlos… Sí, ya lo sé, te refieres a que sea todo como en la nave de Star Trek, sólo hablando a una especie de cerebro central que controla toda la nave… casa.

Creo que faltan muchos años para esto, pero seguro que algún día saldrá un estandar en domótica que sea compatible con los nuevos electrodomésticos y con Siri, y todo se pueda controlar por voz desde nuestro móvil.

Un saludo! 😉
Pau

7
0
Me encantaría saber tu opinión, por favor, deja un comentariox
()
x