|  | 13 января 2013 | Информационные технологии

Исследователи отучили сквернословить суперкомпьютер Watson, очистив некоторые участки его памяти

Суперкомпьютер IBM Watson


Любой из языков, на котором говорят люди, немного изменяется со временем. В разговорной речи люди нередко объединяют различные слова, разделяют обычные слова на два слова, сокращают их тем или иным способом. Из-за этого иногда в обычной речи возникают весьма необычные и курьезные обороты, применять которые могут только люди определенного склада и только в определенных ситуациях. Любой человек, независимо от его интеллектуальных способностей, без особого труда может отфильтровать свою речь в зависимости от окружающей ситуации, но это является огромной проблемой для компьютерного искусственного интеллекта, который запрограммирован для общения на естественном языке.

В 1999 году Аарон Пэкхем (Aaron Peckham), который в тот момент являлся студентом Калифорнийского политехнического университета, создал онлайн-сервис Urban Dictionary. Этот сервис является англоязычным онлайн-словарем в который заносятся сленговые слова и выражения, сопровождаемые словарными определениями. На февраль месяц 2012 года в словаре Urban Dictionary уже содержалось около 6.4 миллиона слов и выражений, среди которых достаточно много "крепких" нецензурных выражений.

У исследователей, занимающихся разработкой и совершенствованием системы искусственного интеллекта суперкомпьютера Watson компании IBM, появилась замечательная на их взгляд идея "скормить" содержимое словаря Urban Dictionary суперкомпьютеру. По мнению исследователей, такая формализация неофициального языка общения могла бы стать хорошей помощью Watson-у в понимании способа, которым общаются обычные люди, И после недолгих раздумий команда исследователей позволила суперкомпьютеру загрузить словарь Urban Dictionary в его память, произвести обработку и индексацию полученных данных.

Тут же возникла проблема, связанная с тем, что неофициальный язык является "грязным" и грубым языком, полным проклятий, оскорблений, новых названий старых "грязных" терминов и т.п. Система искусственного интеллекта Watson-а не смогла определить различий между вежливым языком и множеством профанаций, которыми полон словарь Urban Dictionary. Помимо этого суперкомпьютер Watson успел нахвататься словечек и из других источников, в том числе и из Википедии. В результате речь, синтезируемая суперкомпьютером, превратилась в поток ругательств и оскорблений, на некоторые вопросы исследователей суперкомпьютер отвечал просто, коротко и доходчиво: "bullshit" -)).

После этого исследователям ничего не оставалось делать, кроме как очистить память суперкомпьютера Watson от данных словаря Urban Dictionary. Помимо этого, команда из 35 специалистов разработала программный фильтр, который будет препятствовать суперкомпьютеру ругаться и употреблять нецензурные выражения в будущем, независимо от источника, через который они к нему попали.




Ключевые слова:
Язык, Общение, Люди, Сленг, Ругательства, Словарь, Urban Dictionary, Суперкомпьютер, Искусственный, Интеллект, IBM, Watson

Первоисточник

Другие новости по теме:
  • Суперкомпьютер Watson становится консультантом и психологом, помогающим быв ...
  • Компания IBM начинает конкурс по интеграции технологий искусственного интел ...
  • Медики обращаются к возможностям суперкомпьютера Watson для поиска методов ...
  • IBM отправляет суперкомпьютер Watson учиться в ВУЗ
  • Суперкомпьютер Watson компании IBM становится финансистом с Уолл-стрит.




  • 13 января 2013 09:49
    #1 Написал: gendalf

    Публикаций: 0
    Комментариев: 620
    испугались что компьютер стал слишком на человека похож xD
        
    14 января 2013 09:19
    #2 Написал: EduardLt

    Публикаций: 0
    Комментариев: 190
    Но будет правильно, если компьютер сможет воспринимать не нормативную лексику. Это на самом деле удобный прием передачи мысли, которая синтезирована из интуитивных представлений, или в ситуациях, когда для подбора точных определяющих слов нет времени.

    Человеку не важны слова, когда есть множество способов передачи своих мыслей. И еще важно учитывать мимику говорящего, которая также несет смысловой акцент.

    Не надо быть профессором, чтобы объяснить компьютеру как забивать гвозди. Как только компьютер сможет без проблем забивать гвозди, то это станет показателем правильности работы программы речи.
        
    14 января 2013 09:34
    #3 Написал: volod

    Публикаций: 0
    Комментариев: 1489
    Вот только к ненормативной лексике привыкают не от недостатка слов или времени, а по психологическим причинам.
        
    14 января 2013 09:55
    #4 Написал: EduardLt

    Публикаций: 0
    Комментариев: 190
    Людей от этого не отучишь, привычка лечится другой привычкой.

    Анекдот.
    Приходит Электронник к порфессору Громову и говорит :
    - Профессор Громов, меня Сыроешкин послал нафуй.
    - Почему ?

    - Он говорит, что мне не получится стать человеком, потому-что меня невозможно научить забивать гвозди.
    - Элек, да это же как два пальца обасцать.
        
    14 января 2013 17:23
    #5 Написал: Warhamer

    Публикаций: 0
    Комментариев: 0
    EduardLt, никакой это не удобный прием передачи мысли(я про сквернословие и мат), а всего лишь показатель скудоумия.
        
    18 января 2013 11:19
    #6 Написал: pycha

    Публикаций: 0
    Комментариев: 0
    Warhamer, ага ударь себя молотком по пальцу , или к примеру машина заглохла на переезде и поезд приближается то посмотрим на твое скудоумие.
        

    Информация

    Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.