Como funciona o novo sistema que dá voz a Stephen Hawking, criado por Intel e SwiftKey
Se não fosse pela tecnologia, o professor Stephen Hawking – uma das maiores mentes da nossa época – não teria uma voz, um meio para expressar ideias que ampliam a nossa compreensão do universo. Hoje, sua voz sintetizada talvez seja uma das mais imediatamente reconhecíveis no mundo.
No entanto, o cosmólogo e físico teórico – agora com 72 anos – está debilitado por sua luta contra a esclerose lateral amiotrófica (ALS). Sua capacidade de comunicação vem se deteriorando muito: às vezes, ele não conseguia digitar mais do que uma palavra por minuto usando seu computador.
Agora, graças ao ACAT (Kit de Ferramentas Assistivas Cientes do Contexto), um sistema criado pela Intel, Hawking está mais prolífico do que em toda sua trajetória lutando contra a ALS. Ele mesmo diz: “isso mudou minha vida”.
“Meu sistema anterior tem mais de 20 anos de idade, e era muito difícil continuar a me comunicar de forma eficaz e fazer as coisas que gosto todos os dias”, disse o professor Hawking na inauguração do novo sistema ACAT em Londres.
“Eu agora sou capaz de dar palestras, escrever artigos e livros e falar muito mais rápido. Este novo sistema mudou minha vida, e espero que me sirva bem pelos próximos 20 anos.”
Interface contextual
Criado em colaboração entre a Intel e os mestres de previsão de texto na Swiftkey (sob o escrutínio do próprio Hawking), o novo sistema ACAT permite a Hawking escrever com o dobro da velocidade, e navegar por seu computador e aplicativos dez vezes mais rápido que antes.
Para a Intel, o maior trabalho foi simplificar (em vez de refazer completamente) a interface de usuário usada por Hawking, permitindo que o professor aproveite a familiaridade de um sistema que ele usa há 20 anos.
Hawking só controla a interface usando um sensor na bochecha, detectado por um interruptor infravermelho instalado em seus óculos – e isso não mudou. O sensor é conectado a um laptop da Lenovo rodando Windows.
O trabalho da Intel foi, na maior parte, fazer com que a interface mudasse de acordo com o contexto. Por exemplo, temos a navegação na web: Hawking antes precisava sair da janela onde se digita texto, abrir um ponteiro do mouse que se move devagar pela tela (primeiro verticalmente, depois na horizontal, esperando que Hawking o interrompa) até o ícone do navegador web, deixar o ponteiro do mouse novamente rastejar até a barra de busca, desativar o ponteiro do mouse e abrir novamente a ferramenta para inserir texto.
“Há uma forte dependência em usar mouse numa interface padrão de usuário, e para alguém como Stephen, isso se torna um processo muito complicado”, explicou Lama Nachman, engenheira principal e chefe do projeto. “Imagine que uma tarefa tão simples quanto abrir um documento pode levar até três minutos.”
Usando o ACAT, a navegação na web pode ser automatizada e feita rapidamente, com base no contexto do que o trabalho de Hawking precisa naquele momento, usando um novo menu de comandos.
O trabalho da Intel também descobriu descuidos pequenos, mas bem frustrantes, na interface antiga de Hawking: o professor sempre pôde escrever e-mails, mas ele precisava do auxílio de outra pessoa para incluir um anexo. Este é apenas um dos muitos pequenos ajustes para melhorar a vida ativa de Hawking.
Digitar mais rápido
Enquanto a Intel trabalhou na interface, a Swiftkey criou um modelo de linguagem sob medida para o professor, utilizando algumas tecnologias existentes para smartphone e tablet, e adicionando novas técnicas adaptadas às necessidades de Hawking.
Concentrando-se em Hawking como um usuário específico, a Swiftkey desenvolveu um modelo que reconhece o tom formal/informal do professor de um documento para outro, fazendo sugestões inteligentes para um vocabulário casual de um e-mail, ou para o léxico complexo de um artigo científico.
Com isso, Hawking só precisa introduzir 15% a 20% dos caracteres que ele fala ou escreve: o software é capaz de predizer o resto, tornando-o imensamente mais produtivo. “A entrada de texto não deve se limitar ao hardware: não é sobre teclados, é sobre linguagem”, disse Joe Osborne, do SwiftKey.
“Stephen nos deu acesso sem precedentes à vida dele”, disse Pete Dunham, diretor de experiência do usuário no Intel Labs. “Uma coisa importante a se notar é que isso reduz a quantidade de força que ele precisa usar, reduzindo a quantidade de passos necessários para chegar a um ponto. Se você é um corredor, seus músculos cansam com o tempo. E isso é a mesma coisa que acontece com Stephen: mesmo que seja um pequeno músculo no rosto, depois de um dia de trabalho, ele acaba ficando completamente desgastado.”
Vale notar que Hawking pediu para não mudar a voz sintetizada pela qual ele é conhecido, e que se tornou parte de sua identidade.
Código aberto
Embora a tecnologia da Swiftkey continue sendo proprietária, o restante da pesquisa e desenvolvimento do ACAT terá seu código aberto a partir de janeiro de 2015. As equipes envolvidas vão oferecer o código inicialmente para universidades, na esperança de expandir o desenvolvimento da plataforma, acreditando que sua natureza modular poderia ajudar três milhões de pessoas em todo o mundo que sofrem de doenças do neurônio motor e tetraplegia.
“Estamos empurrando os limites do que podemos fazer com a tecnologia, e sem isso eu não seria capaz de falar com você hoje”, disse Hawking.
A Intel não revela o custo exato da construção do sistema, mas porta-vozes no evento dizem que, considerando que isto levou três anos e muitos desenvolvedores para chegar a esta fase, o custo seria alto. Mas o resultado talvez tenha um valor inestimável.
“É Stephen Hawking”, Dunham disse aos presentes na conferência. “O preço não importa.”
Nenhum comentário
Postar um comentário