Озвучивает джарвиса. Практически «Джарвис»: Цукерберг создал дома искусственный интеллект, как у «Железного человека. Что Джарвис умеет делать

Прочие модели 10.04.2019

Прочие модели

Большинству пользователей известно, что система Siri считается наиболее востребованным личным помощником и вопросно-ответной технологией на iOS-гаджетах. К счастью, не только система Siri доступна на рынке. Так, поклонникам фантастики и комиксов, созданных фирмой Marvel, предлагается персональный помощник JARVIS из кинофильма «Железный Человек».

Если владелец девайса видел киноленту «Железный Человек», то ему наверняка известен дворецкий Тони Старка, которого зовут Джарвис. Следовательно, пользователь сможет прибегать к помощи виртуального слуги на собственном портативном аппарате. К тому же, программа JARVIS является уникальной разработкой, применяющей голос и образ персонажа Джарвиса.

Работа утилиты JARVIS начинается с обычных аудиоинструкций по использованию и управлению указанным инструментом. По окончании настройки пользователю понадобится указать свой пол (чтобы виртуальный помощник смог корректно обращаться к владельцу устройства). Кроме того, здесь придется задать единицу измерения основных температурных условий (в частности, градусы по Кельвину, Фаренгейту либо, разумеется, Цельсию).

С детальным перечнем инструкций можно ознакомиться, коснувшись иконки, размещенной в верхнем углу дисплея. При этом все команды должны непременно начинаться с обращения «Джарвис» и обычно содержать одно слово (к примеру, «Джарвис, прогноз погоды»). Также JARVIS умеет уведомлять обладателя девайса о будущих встречах и отображать текущее время. Еще в программе можно создавать разнообразные аудионапоминания.

Важно отметить, что владельцам оптических дисков с киноблокбастером «Железный Человек» утилита JARVIS предоставляет дополнительные возможности. Например, пользователь сможет легко управлять проигрыванием соответствующего фильма при помощи данного виртуального дворецкого.

Полезная информация : если Вы зададите своему виртуальному помощнику вопрос: стоит ли мне купить бмв 740 (http://www.bmw-avtoport.ru/auto/7/), то его ответ со сто процентной вероятностью будет утвердительным! Кстати, приобрести BMW седьмой серии Вы можете прямо сейчас на самых выгодных для себя условиях! Все, что Вам для этого нужно сделать, это посетить сайт www.bmw-avtoport.ru.

Тони Старка, более известного под своим альтер-эго Железного человека. Хоть он и считается второстепенным героем, но порой играет довольно значимую роль в сюжете.

Джарвис ("Марвел"): Биография

Биография этого вымышленного героя комиксов довольна интересна. Известно, что до того, как стать дворецким в доме Старков, Джарвис был военнослужащим, а именно пилотом в Королевских воздушных силах Канады. К тому же он был героем Второй мировой войны, по окончании которой возвращается на постоянное место жительства в Соединенные Штаты.

Родился Джарвис в Бруклине, поэтому изначально не обладал присущими его поведению джентльменскими манерами и британским акцентом, которые он, по-видимому, приобрел во времена службы в армии.

Эдвин Джарвис ("Марвел") устраивается на работу дворецким в особняк небезызвестного Говарда Старка и его супруги по имени Мария. Однако даже после их смерти Джарвис продолжил свою службу в этом доме, теперь уже у сына и наследника могущественной промышленной империи Старков Тони.

Когда Тони Старк вырос и стал Железным человеком, Джарвис продолжал верно служить ему, а затем - и команде супергероев под названием "Мстители", лидером которой был Тони. После того как Алая Ведьма разрушила фамильное имение Старков, Мстители были передислоцированы в башню Старка - небоскреб, принадлежащий компании Железного человека. Эдвин последовал за ними, продолжая верно нести службу.

Появление в кино и ТВ

Помимо комиксов, Джарвис неоднократно появлялся на телевидении и в кино. В числе произведений, где присутствует Джарвис ("Марвел"): мультсериалы "Мстители. Всегда вместе" (1999-2000) и "Мстители: Могучие Герои Земли" (2010-2013), а также полнометражные анимационные фильмы "Ultimate Мстители" (2006) и его сиквел "Ultimate Мстители 2", который тоже вышел в 2006 г.

Но на этом появления Джарвиса в фильмах не прекратилось. Когда компания Marvel начала строить свою кинематографическую вселенную, этот персонаж был введен в нее в качестве искусственного интеллекта, который исполняет роль дворецкого в доме Тони Старка, а также осуществляет практически полное управление всеми системами в "Башне Мстителей" и костюмами самого Железного человека в том числе.

Киновселенная Marvel

Решение о том, что Джарвис ("Марвел") в фильме "Железный человек" (2008) будет представлен в виде ИИ, было принято в связи с тем, что создатели не хотели, чтобы герой вызывал ассоциации с Альфредом - дворецким Бэтмена в комиксах DC. К тому же фильм и так имел довольно много сходств с картиной "Бэтмен: Начало".

В комиксах "Марвел" конца XX в. Тони создает ИИ под названием Гомер, который и стал своего рода прототипом для кинематографического Джарвиса. Два героя комиксов были объединены в одного. Так и получился искусственный интеллект Джарвис-дворецкий.

Он появляется в трилогии про Железного человека, а также двух фильмах про Мстителей.

Видеоигры и книги

Джарвис ("Марвел") появляется не только в комиксах, мультфильмах и блокбастерах, но и в книгах, а также в видеоиграх.

Этот персонаж является важным действующим героем в серии книг про "Железного человека", основанных на одноименных комиксах и кинофильмах, автором которой является писатель Питер Девид.

А также Джарвис ("Марвел"), фото которого, а точнее иллюстрированное изображение вы можете видеть выше, является одним из героев нескольких видеоигр, созданных по мотивам полнометражных фильмов о Железном человеке. К примеру, он появляется в игре Marvel: Ultimate Alliance, где его голосом стал Филип Проктор - известный американский актер озвучки, который имеет на своем счету большое количество мультипликационных и киноработ.

Помимо этого, Джарвис присутствует в таких играх, как: "Железный человек" (озвучен Гиллоном Стивенсоном), "Железный человек 2", где его голосом стал Эндрю Чайкин.

Джарвис ("Марвел"). Актер

Наверное, самым известным актером, которому довелось исполнить роль Джарвиса, является который сыграл его во всех лентах киновселенной Marvel, где появляется ИИ Джарвис. К слову, Пол также является исполнителем роли Вижена, который в кинематографической вселенной расценивается как плотоническое тело Джарвиса.

Сам актер утверждал, что когда соглашался на эту роль в 2008 г., понятия не имел о том, что из себя представляет данный персонаж. Беттани согласился озвучить Джарвиса только потому, что его друг являлся режиссером киноблокбастера "Железный человек".

Сегодня актер очень доволен, что тогда согласился на эту роль. Тем более ему удалось расширить свое присутствие в самой преуспевающей комиксовой киновселенной, исполнив роль Вижена.

В комиксах Джарвису однажды промыл мозги Альтрон, сделав его злодеем Алым Плащом, который впустил в особняк Мстителей команду Победителей зла. Между ними и Мстителями произошло сражение, в котором силам добра удалось одержать победу. У Эдвина восстановился рассудок, и он вновь взялся за исполнение своих обязанностей.

Когда на планету Земля началось вторжение скруллов - инопланетных захватчиков, которые способны изменять свою внешность, Джарвис был заменен на одного из них. Под видом Джарвиса скрулл похищает дочку Люка Кэйджа и Джэссики Джонс, однако вскоре его настигает смерть от рук маньяка-убийцы, которого в комиксах именуют как Меченого.

В серии комиксов под названием "Темное правление" Эдвин не согласился служить Темным Мстителям под предводительством Он покидает башню Старка и присоединяется к Хенку Пиму, более известному под своим альтер-эго Человека-муравья.

Заключение

Персонаж Джарвиса ("Марвел") не является ключевым ни в комиксах, ни в кинематографической вселенной, но всегда играет довольно значительную роль в сюжете, будучи своего рода наставником и правой рукой лидера команды Мстителей Тони Старка.

Его высокие манеры поведения, должность дворецкого и роль помощника Железного человека невольно приводят к ассоциациям с дворецким Бэтмена (Брюса Уэйна), поскольку аналогий довольно много. Несмотря на это, оба персонажа обладают своей индивидуальностью, присущей только им, поэтому нельзя сказать, что они слишком похожи.

Джарвис Эдвин является неотъемлемым героем комиксов и фильмов про Железного человека, поэтому неудивительно, что у него есть довольно большое количество поклонников, которые, впрочем, редко бывают ярыми фанатами именно этого персонажа, но во многом симпатизируют ему, как верному помощнику Тони Старка. Он является отличным второстепенным героем, о котором, возможно, хотелось бы узнать чуточку больше, но не стоит делать спин-оффы с ним в ключевой роли, поскольку вряд ли это много кого заинтересует.

В любом случае Эдвин Джарвис еще не раз появится как на страницах комиксов, так и в кинематографических лентах в образе искусственного интеллекта, который во всем помогает Старку.

Небольшое рассуждение на тему гения Тони Старка в кинематографической вселенной Marvel.

Он завоевал сердца многих фанатов и тех людей, которые никогда не слышали о миллиардере в металлическом костюме. Он является залогом коммерческого успеха фильмов Marvel Studios. Он – Тони Старк, филантроп, гений…и так далее, вы уже слышали эту фразу сто раз.

Многие люди, в реальной жизни и на экране, включая правительство США, видят в костюме Железного Человека огромную угрозу для национальной безопасности. Действительно, достаточно своенравный миллиардер с неограниченными ресурсами гоняет по миру в костюме, способном противостоять целым армиям и, как мы видели в «Мстителях», даже помериться силами с Богом грома.

Не спорим, Железный Человек – очень и очень и очень крутое изобретение Тони, позволяющее ему спасать мир чуть ли не каждый день, но давайте взглянем на другой экспонат его мастерской.

Под конец «Мстителей» (сейчас будет СПОЙЛЕР) Тони Старк, управляя костюмом Mark VII , сумел успешно перехватить ядерную ракету, запущенную военными, и отправить ее в портал, из которого на Землю вторглись силы Читаури. Во время полета Джарвис , персональный компьютерный ассистент героя предложил Тони позвонить Пеппер, так как он понимал, что его жизнь может вот-вот оборваться. Машина, компьютер, называйте его как хотите, предложила шанс на последнее «прощай», чтобы между Тони и Пеппер не осталось недосказанности! Джарвис проявил чувства, продемонстрировал эмпатию, доказал, что он живой.

Конечно, реактор, придуманный Тони тоже является серьезным технологическим прорывом, но разве это сравнится с созданием реального искусственного интеллекта? Фактически, Тони стал Творцом новой формы жизни, и на это никто не обратил внимание. Мы сто раз становились свидетелями, как Джарвис взламывал защищенные сети других компаний или учреждений, будь то Щ.И.Т. в «Мстителях» или системы Джастина Хаммера в «Железном Человеке 2» (там, правда, герой пользовался подобием смартфона, но мы уверены, что дело не обошлось без верного дворецкого), но окружающие отказывались замечать этот козырь в рукаве миллиардера.

Гордый Тони Старк , который всю свою жизнь делал оружие, а на личном фронте его отношения не длились больше одной ночи, создал себе идеального друга, партнера…он создал свою совесть. Он назвал ее Джарвис и наградил голосом одного известного британского актера. Разве это не является самым величайшим достижением Старка всей его жизни?! К тому же, Джарвис способен удаленно управлять множеством костюмов Железного Человека без участия Тони. Учитывая уже упомянутую способность проникать в защищенные сети, компьютерный дворецкий становится подобием вежливой и говорящей версии SkyNet. Он вполне способен в считанные часы парализовать работу всех компьютерных систем по всему миру, попутно контролируя любое сопротивление при помощи различных модификаций костюмов Железного Человека, не забывая вежливо извиняться с присущей ему британской тактичностью.

Джарвис расшифровывается как Just A Rather Very Intelligent System (Просто довольно очень умная система), но эта формулировка очень далека от истины. Возможности Джарвиса практически не имеют пределов, и, возможно, когда-нибудь это аукнется Тони Старку и его союзникам.

Марк Цукерберг создал искусственный интеллект Джарвис как из «Железного человека». Он управляет домом гендиректора Facebook, ставит ему музыку и выстреливает чистые серые футболки из специальной пушки. Мы ответили на главные вопросы об искусственном интеллекте от Цукерберга и перевели его оригинальный пост о процессе разработки Джарвиса.

Цукерберг год назад поставил цель создать искусственный интеллект

В начале каждого года Марк Цукерберг ставит себе цели на грядущие 12 месяцев. В 2010 году этой целью было выучить мандарин (диалект китайского языка), а в 2015-м - читать по две книги в месяц.

На этот год Цукерберг пообещал себе создать искусственный интеллект, как из «Железного человека». По задумке, он должен был управлять освещением, камерами и музыкой в доме.

В этот понедельник, 19 декабря, основатель Facebook заявил о завершении проекта и поделился постом, в котором описал процесс создания Джарвиса (искусственный интеллект назван в честь помощника Железного человека).

Что Джарвис умеет делать?

Практически все, что можно ожидать от искусственного интеллекта, подключенного к «умному дому». Он включает и выключает свет и музыку, жарит тосты и открывает двери (благодаря технологии распознавания лиц). Также Джарвис, используя специальную модифицированную пушку, выстреливает Цукербергу его фирменные серые футболки.

Среди функций Джарвиса есть и менее практичные способности. Например, Цукерберг научил его простой игре: он или его жена Присцилла спрашивают искусственный интеллект «кого нужно пощекотать», и Джарвис произвольным образом отвечает «Макс» или «Бист» (так зовут их дочь и собаку соответственно).

Как Цукерберг создавал Джарвиса?

Сам Цукерберг в своем посте разделил процесс создания Джарвис на пять больших блоков: объединенный дом, натуральный язык, распознавание лиц и объектов, бот для Facebook Messenger и распознавание речи.

Во-первых, чтобы функционировать, у Джарвиса должен быть доступ к объединенной системе устройств по всему дому (лампы освещения, камеры, бытовая техника).

Во-вторых, искусственный интеллект должен понимать натуральный язык, то есть запросы вроде «сыграй что-нибудь из Канье Уэста».

В-третьих, Джарвису необходимо узнавать лица людей, чтобы оповещать Цукерберга о гостях или определять расположение членов семьи в доме.

В-четвертых, Цукерберг хотел иметь возможность говорить с Джарвисом не только с одного устройства, но и с любого телефона. Для этого он решил создать чат-бота в Facebook Messenger.

Наконец, Джарвис также должен был уметь распознавать устную речь и тоже отвечать голосом.

«Искусственный интеллект и ближе, и дальше, чем мы думаем»

Как отметил глава Facebook, его главной целью в процессе создания Джарвиса было узнать больше о состоянии искусственного интеллекта в современном мире. По его словам, ИИ может делать впечатляющие вещи - управлять машинами, лечить болезни и открывать планеты.

Однако проблема современного искусственного интеллекта кроется в самих людях. Мы еще не знаем, что такое интеллект, и пока мы не ответим на этот вопрос, настоящий ИИ нам не создать.

А кто озвучивает Джарвиса? (обновлено)

Цукерберг поделился роликом, в котором показывает аспекты работы Джарвиса. Из видео также становится ясно, что искусственный интеллект озвучен актером Морганом Фриманом.

В октябре этого года Цукерберг спросил на своей странице в Facebook, кого ему стоит пригласить для озвучки Джарвиса. Люди начали рекомендовать ему Моргана Фримана, известного ученого Нила Деграсса Тайсона и, да, самого Железного человека Роберта Дауни-младшего.

Актер ответил на этот комментарий и вроде бы согласился на предложение - при условии, что гонорар получит Пол Беттани (озвучивающий Джарвиса в фильмах про Железного человека).

Впрочем, в итоге за работу взялся Фриман.

Перевод поста Цукерберга, в котором он объясняет процесс разработки Джарвиса

Моим личным вызовом на 2016 год было создать простой искусственный интеллект, который управлял бы моим домом - совсем как Джарвис в «Железном человеке».

Моей целью было узнать о состоянии искусственного интеллекта - и оказывается, мы зашли гораздо дальше, чем многие люди себе представляют (тем не менее, нам еще далеко до финиша). Подобные испытания всегда приводят к тому, что я учусь и узнаю больше ожидаемого, и этот проект не стал исключением: он помог мне осознать внутреннюю систему для инженеров Facebook, которую мы используем в компании, а также дал мне общее представление об «умных домах».

За этот год я построил простой ИИ, с которым я могу разговаривать по телефону и компьютеру: он контролирует мой дом, освещение, температуру, музыку, безопасность; он узнает мои привычки и вкусы; он учит новые слова и концепты; плюс, он даже развлекает Макс [дочь Цукерберга - прим. ред]. Он использует несколько техник искусственного интеллекта, включая обработку натурального языка, распознавание речи и лиц и машинное обучение - всё это написано в Python, PHP и Objective C. В этой заметке я объясню, что я построил и чему научился в процессе.

Ролик, в котором Цукерберг демонстрирует работу Джарвиса

Начинаем: Соединяя дом

В некотором смысле, этот вызов оказался легче, чем я ожидал. На самом деле, моя цель по бегу (пробежать 365 миль в 2016 году) заняла даже больше времени. Но один аспект, который принес мне много сложностей, это процесс объединения всех различных систем в моем доме.

Перед тем, как построить ИИ, мне нужно было написать код, который бы соединил все эти системы, написанные на разных языках программирования. Мы [семья Цукерберга] используем Creston для освещения, термостата и дверей, Sonos со Spotify для музыки, Samsung для телевизора, Nest для камер и, естественно, Facebook для моей работы. В большинстве случаев мне пришлось заняться обратным инжинирингом API для этих систем, чтобы заставить их отвечать на мои команды включить свет или музыку.

Дальше встал вопрос того, что многие из этих устройств не подключены к интернету. Некоторые из них можно включать и выключать, используя интернет, но этого недостаточно. Например, у меня было много трудностей с поиском тостера, который с отключенным питанием позволит опустить хлеб, чтобы автоматически начать его жарить при включении. В итоге я купил старый тостер из 1950-х и приделал к нему подключенный [к сети] переключатель. Таким же образом я модифицировал кормилку для Биста [собака Цукерберга] и пушку для серых футболок.

Для того, чтобы помощники вроде Джарвиса могли управлять всем в наших домах, нам нужно больше подключенных [к интернету] устройств, а индустрии необходимо разработать общие API и стандарты для того, чтобы устройства могли друг с другом разговаривать.

Естественный язык

Когда я написал код, с помощью которого мой компьютер мог управлять всем домом, следующим шагом была коммуникация: я хотел разговаривать с компьютером и домом так же, как я говорю с кем-либо другим. Это был двухступенчатый процесс: сначала я научил его понимать текстовые сообщения, а затем добавил возможность голосового ответа и обработки речи в текст.

Я начал с простых ключевых слов вроде «спальня», «свет», «включен»: компьютер искал эти слова в предложении и, если нужно, включал свет в спальне. Вскоре стало ясно, что он должен также выучить синонимы - например то, что гостиная и семейная комната значат одно и то же в нашем доме. Это значит, я должен был научить его усваивать новые слова и концепты.

Понимание контекста важно для любого ИИ. Например, когда я говорю своему [ИИ, Джарвису] включить кондиционер в «моем офисе», это означает совершенно иное, нежели когда Присцилла [жена Цукерберга] просит его о том же самом. Сколько различных проблем всплыло из-за этого! Или, например, если вы просите его приглушить свет или сыграть песню, не уточняя определенную комнату, ему нужно знать, где вы находитесь - иначе в музыка зазвучит в комнате Макс именно в тот момент, когда она спит. Упс.

Музыка - более интересная и сложная плоскость для естественного языка, потому что существует слишком много артистов, песен и альбомов, и простой поиск по ключевым словам не срабатывает. Свет можно только включить или выключить, а когда вы говорите «сыграй X», даже самые маленькие вариации могут означать совершенно разные вещи. Возьмите к примеру несколько запросов, связанных с Адель: «сыграй someone like you», «сыграй кого-либо вроде Адель», «сыграй Адель» [игра слов на английском, в оригинале запросы выглядят так: “play someone like you”, “play someone like adele”, “play some adele”]. Они звучат похоже, но каждый из них относится к разным категориям запросов. Первый просит сыграть определенную песню, второй рекомендует артиста, а третий создает плейлист из лучших песен Адель. Сквозь систему позитивных и негативных отзывов, я научил свой ИИ видеть эти отличия.

Чем больше контекста предоставлено ИИ, тем лучше он справляется с открытыми запросами. Сейчас, если я прошу Джарвиса «включить музыку», он просматривает списки прослушанных мною песен и чаще всего выбирает именно то, что я хотел бы услышать. Если он ошибается с настроением, я могу просто сказать ему что-то вроде «это не легкая музыка, поставь что-нибудь легкое», и он сразу проклассифицирует песню и исправит запрос. Также он различает меня и Присциллу, и выдает нам индивидуальные рекомендации. В целом, я понял, что мы используем открытые запросы гораздо чаще специфических.

Распознавание объектов и лиц

Примерно одна треть головного мозга посвящена зрению, и у ИИ есть множество проблем, связанных с пониманием того, что происходит на фото или видео. Эти проблемы включает в себя отслеживание (например, проснулась ли Макс и ползает ли она по своей кроватке?), распознавание объектом (это Бист или ковер в той комнате?) и распознавание лиц (кто стоит перед дверь?).

Распознавание лиц - особенно сложная версия распознавания объектов, потому что большинство людей выглядят относительно похоже (компьютеру легче отличить друг от друга два произвольных объекта, например, сэндвич и дом). Но Facebook очень хорош в распознавании лиц, чтобы отмечать друзей в ваших фотографиях. Та же самая технология подходит для того, чтобы ИИ мог определить, кто из ваших друзей стоит у дверей вашего дома.

Для этого, я просто установил несколько камер на моей двери, которые захватывают картинку с разных углов. Сегодняшние ИИ пока еще не умеют идентифицировать людей по их макушкам, потому наличие нескольких углов гарантирует, что компьютер получит изображение лица. Я построил простой сервер, которые постоянно мониторит обе камеры и выполняет двухступенчатый процесс: во-первых, он запускает процесс выявления лиц (который позволяет определить, что к двери подошел человек), во-вторых, если он находит лицо, запускается процесс распознавания лиц (который позволяет определить, кто именно подошел к двери). Как только он определил гостя, компьютер сверяется с определенным списком - если я ожидал этого человека сегодня, то он впускает гостя и дает мне знать о его прибытии.

Такой тип визуальной системы у ИИ очень подходит для определенного числа вещей: например, он знает, когда Макс просыпается, и начинает играть ей музыку или урок языка мандарин [китайский диалект], или решает проблему контекста, зная в какой комнате мы находимся и точно отвечая на открытые запросы вроде «включи свет». Как и большинство аспектов этого ИИ, зрение является полезным, когда оно информирует более широкую модель мира, объединяя другие способности - например, зная ваших друзей и открывая им дверь по их прибытии. Чем больше контекста у системы, тем умнее она становится.

Чат-бот в Messenger

Я программировал Джарвис на своем компьютере, но для того, чтобы он был по-настоящему полезным, мне нужен был доступ к нему из любого места. Это означало, что для коммуникации мне нужно было использовать телефон, а не девайс, установленный у меня дома.

Я начал с создания чат-бота для Messenger для связи с Джарвис, потому что это гораздо легче, чем создать отдельное приложение. У Messenger очень простой фреймворк для создания ботов, который автоматически делает множество вещей за вас - включая работу и на iOS, и на Android, поддержку текста, изображений и аудио, доставку уведомлений и многое другое. Подробнее о фреймворке для ботов вы можете узнать на сайте messenger.com/platform.

Я могу написать что угодно боту Джарвис, и он автоматически передаст это серверу Джарвис и обработает запрос. Я могу также отправлять аудиозаписи, и сервер переведет их в текстовую форму и исполнит запрос. В середине дня, если я возвращаюсь домой, Джарвис пишет мне о том, кто там сейчас находится или что мне нужно сделать.

Один из сюрпризов, который я обнаружил при создании Джарвис - то, что когда у меня есть выбор между речью и текстом для связи с Джарвис, я пишу ему гораздо чаще ожидаемого. На это есть множество причин, но главная заключается в том, что это не мешает людям вокруг меня. Если я запрашиваю что-то связанное с ними, например прошу включить музыку для нас всех, то я использую голосовой запрос, но в большинстве случаев мне удобнее писать Джарвису. Схожим образом, когда Джарвис коммуницирует со мной, я предпочитаю текст, а не голос. Это потому, что речь бывает нестабильной, а текст дает больше контроля над тем, что вы хотите видеть. Даже когда я говорю с Джарвис, если я делаю это по телефону, я предпочитаю, чтобы он показывал свой ответ.

Это предпочтение текстовой коммуникации вместо голосовой - паттерн, который мы также видим в Messenger или WhatsApp, где объем текстовых сообщений растет гораздо быстрее объема голосовых. Значит, будущие ИИ продукты не могут полагаться лишь на голос [как это делает, например, Amazon Echo] и им стоит иметь интерфейс для личных переписок. Я всегда был оптимистичен насчет ИИ-ботов, но мой опыт с Джарвисом сделал меня еще более уверенным в том, что в будущем мы будем общаться с ботами вроде Джарвиса.

Несмотря на мое мнение о том, что текст будет более важным при связи с будущими ИИ, я все равно считаю, что голос тоже играет не менее важную роль. Самое главное преимущество голоса - он быстрее. Вам не нужно доставать телефон, открывать приложение и начинать печатать - вам нужно лишь говорить.

Чтобы включить функцию голоса для Джарвиса, мне нужно было построить специальное приложение, которые бы постоянно прислушивалось к тому, что я говорю. Чат-бот Messenger прекрасен для многих вещей, но для постоянного мониторинга моей речи он плохо подходит. Мое собственное приложение Джарвиса позволяет мне положить телефон на стол, и он будет меня слушать. Я также могу положить несколько телефонов с приложением Джарвиса по всему дому, чтобы иметь возможность использовать его из любой комнаты.

Эта идея схожа с видением Amazon, которая реализует его со своим голосовым помощником Echo, но на своем опыте я обнаружил, что мне крайне часто хочется обратиться к Джарвису вне дома. Потому иметь телефон в качестве основного интерфейса вместо специально домашнего девайса - критически важно.

Я разработал первую версию приложения Джарвиса на iOS, и планирую сделать версию для Android в ближайшее время. Я не делал приложений для iOS с 2012 года, и одним из моих главных наблюдений стало то, что инструменты, которые мы создали в Facebook для разработки подобных программ, очень впечатляют в качестве распознавания речи.

Технология распознавания речи в последнее время значительно усовершенствовалась, но ни один искусственный интеллект еще не умеет понимать разговорную речь на лету. Распознавание речи полагается на прослушивание того, что вы говорите, и предсказание того, что вы скажете дальше, потому структурированная речь гораздо легче для понимания, нежели неструктурированный разговор.

Другое интересное ограничение в системах распознования речи - и машинного обучения в целом - это то, что они оптимизированы для специфических проблем. Например, понимать разговор человека с компьютером - не совсем то же самое, что понимать разговор человека с другим человеком. Если вы учите машину, предоставляя ей данные из поисковых запросов Google, когда люди разговаривают со строкой поиска, то эта машина будет работать хуже на сайте Facebook, где люди разговаривают друг с другом.

В случае с Джарвисом, он предназначен для распознавания речи с близкого расстояния, в отличие от Echo, с которым вы можете говорить из другого конца комнаты. Эти системы более специализированы, чем мы думаем, и это значит, что мы далеки от обобщенных систем [ИИ].

На психологическом уровне, когда вы говорите с машиной, вы автоматически присваиваете разговору больше эмоциональной глубины, нежели когда вы общаетесь с ней посредством текста или графического интерфейса. Одно любопытное наблюдение, которое я обнаружил при интегрировании голоса в Джарвиса, это то, что я хотел в нем больше юмора. Отчасти для того, чтобы он смог взаимодействовать с Макс и развлекать ее, и отчасти для того, чтобы он лучше интегрировался [в нашу семью].

Я научил его небольшим веселым играм вроде той, где я или Присцилла спрашиваем его, кого мы должны пощекотать следующим, а он произвольным образом отвечает «Макс» или «Бист». Ради смеха я также добавил несколько классических строчек вроде «Прости, Присцилла. Я боюсь, что не смогу этого сделать» [отсылка на искусственный интеллект HAL-9000 из фильма Стэнли Кубрика «Космическая одиссея 2001 года»].

Есть еще множество вещей, которые можно исследовать в плоскости голоса. Технологии ИИ уже достаточно хороши для отличного продукта, и они будут становиться лишь лучше в ближайшие годы. В то же время, я думаю, что лучшими продуктами станут те, которые вы сможете взять с собой и приватно использовать в любом месте.

Среда разработки Facebook [или немного рекламы от Цукерберга- прим. ред]

Как гендиректор Facebook, я больше не пишу код для нашей внутренней среды. Тем не менее, я никогда не прекращал кодить, хотя теперь делаю это для персональных проектов вроде Джарвиса. Я ожидал узнать многое о сегодняшнем состоянии дел с искусственным интеллектом, но я и не представлял, что также узнаю о том, каково это быть инженером Facebook. Вкратце - это впечатляюще.

Мой персональный опыт ознакомления с базой кода Facebook, скорее всего, похож на опыт наших новых инженеров. Я постоянно удивлялся тому, насколько хорошо организован код и как легко найти то, что вам нужно - неважно, связано ли это с распознаванием лиц и речи, с фреймворком для создания чат-ботов или разработкой приложения для iOS.

Опенсорсные пакеты Nuclide, которые мы построили для работы с гитхабовским Atom, делают разработку гораздо легче. Среда разработки Buck, которую мы создали для работы над большими проектами, тоже сэкономила мне много времени. Наш опенсорсный искусственный интеллект FastText, который классифицирует текст, тоже стоит посмотреть одним глазом, если вы заинтересованы в разработке ИИ - да и вообще, покопайтесь в гитхабовском репозитории Facebook Research.

Одна из наших ценностей - двигаться быстро. Это значит, что вы должны прийти сюда [в компанию Facebook] и построить приложение быстрее, чем где-либо еще. Вы должны прийти сюда и уметь пользоваться нашей инфраструктурой и инструментами для ИИ, для разработки вещей, на которые вы бы потратили гораздо больше времени при работе в одиночку. Создание внутренних инструментов, которые делают [программную] инженерию более эффективной, важно для любой технологической компании, и мы очень серьезно подходим к этому вопросу. Так что я призываю вас тоже пользоваться нашими инструментами, это никому не помешает.

Следующие шаги

Несмотря на то, что этот вызов подходит к концу, я уверен, что продолжу работать над усовершенствованием Джарвиса, так как я использую его каждый день и постоянно нахожу новые функции, которые хотел бы добавить.

В ближайшем будущем моими следующими шагами будет построить приложение для Android, настроить голосовые терминалы Джарвиса в большем числе комнат по дому и соединить больше техники. Я бы хотел, чтобы Джарвис управлял моим Big Green Egg [керамический гриль] и помогал мне в готовке, но это потребует более продвинутых модификаций, нежели оборудование пушки для футболок.

В долгосрочной перспективе, я хотел бы научить Джарвиса осваивать новые функции самостоятельно, вместо того чтобы каждый раз собственноручно программировать его для специальных задач. Если бы я провел еще один год на этом челлендже, я бы сфокусировался на штудировании того, как работает [машинное] обучение.

Наконец, было бы интересно найти способы сделать [Джарвиса] доступным для всего мира. Я думал о том, чтобы сделать его код опенсорсным, но сейчас он слишком сильно подвязан к моему собственному дому, его технике и настройкам сети. Если я когда-либо разработаю более абстрактную оболочку, возможно, я её выпущу. Или, конечно, сделаю основой для разработки совершенно нового продукта.

Выводы

Разработка Джарвиса была интересным интеллектуальным испытанием, благодаря которому я пополнил опыт работы с инструментами ИИ в сферах, которые важны для нашего будущего.

Ранее я предсказывал, что в течение 5-10 лет у нас появятся ИИ системы, которые станут более точны в каждом из наших чувств - зрении, слухе, обонянии и т.д., включая вещи вроде языка. Удивительно, насколько мощными уже стали эти инструменты, и этот год лишь убедил меня в этом предсказании.

В то же время мы далеки от понимания того, как работает обучение. Все, что я сделал за этот год - естественный язык, распознавание лиц и речи - всё это варианты фундаментального паттерна распознавательных техник. Мы знаем, как показать компьютеру множество каких-либо примеров и заставить его эти примеры различать, но мы все еще не знаем, как взять идею из одной плоскости и применить её в совершенно другой [например, применить техники из распознавания лиц на распознавании речи].

Для примера: я потратил около 100 часов на разработку Джарвиса в этом году, и у меня получилась довольно хорошая система, которая понимает меня и делает множество вещей. Но даже если бы я потратил еще 1000 часов, я, скорее всего, не смог бы создать систему, которая самостоятельно обучается новым функциям - для этого нужен фундаментальный прорыв в области ИИ.

В определенном смысле, ИИ ближе и дальше, чем мы себе представляем. ИИ ближе в том плане, что он способен выполнять очень мощные задачи - управлять автомобилями, лечить болезни, открывать планеты и понимать медиа. Каждая из этих вещей имеет огромное влияние на сегодняшний мир, но нам все еще предстоит выяснить, что такое настоящий интеллект.

В целом, это было огромным испытанием. Подобные вызовы всегда обучают меня большему, чем я ожидал в начале. В этом году я думал, что узнаю больше об ИИ, но я также узнал об устройстве «умных домов» и внутренней среде разработки Facebook. Это то, что делает подобные испытания интересными. Спасибо за то, что следили за мной в этом испытании, и я с нетерпением жду следующего челленджа, которым я поделюсь через несколько недель.