Рашид заявил, что существенный прогресс стал результатом нововведений на всех стадиях процесса.
ПО вроде Dragon Naturally Speaking компании Nuance уже совершило революцию в области распознавания речи, после чего продукты, основанные на этой технологии, стали доступны широкой публике в виде приложения Siri для iPhone или голосового интерфейса игрового контроллера Kinect. Хотя подобные системы часто ошибаются (по словам Рашида, неправильно интерпретируется каждое четвёртое−пятое слово), они все равно намного лучше своих предшественников. Microsoft применила новую систему машинного обучения на основе искусственных нейронных сетей, которая сокращает непонимание до каждого седьмого−восьмого слова. Это значит, что программа-переводчик Bing Translate выдает генератору речи более точный текст.
Самым же большим достижением стала генерация речи с сохранением модуляций голоса говорящего. Благодаря этому собеседникам будет легче понять друг друга, что повысит эффективность общения. По словам Рашида, он целый час общался с машиной, прежде чем она усвоила все нюансы его разговорной манеры.
«Ещё несколько лет, и мы сломаем языковые барьеры между народами», — обратился к собравшимся Рик Рашид.