Главная Рус Eng

    Компании отрасли региона
  Специальные
предложения
 
Каскад малых ГЭС на реке Белой в Майкопском районе
Представляет: Министерство экономического развития и торговли Республики Адыгея
Отрасль:
Регион:
Объем инвестиций: 688800000 Руб
ID проекта: PRJ001156


Переработка древесины в Иркутской области
Отрасль:
Регион:
Объем инвестиций: 52000000 Руб
ID проекта: PRJ002814








Системы обучения речи слабослышащих

ID:PRJ000110 // Дата обновления: 0000-00-00 // Просмотры: 1

Правообладатели:
Савченко В.В.
Рейтинг проекта:
 5 баллов (10483 голоса)
Объем инвестиций:
100 000 000 Руб

Цель представления:
Соинвестирование

Описание проекта
Проблемы обучения речи детей и подростков с нарушениями слуховых функций (глухонемых и слабослышащих) сводятся, главным образом, к проблемам теории и практики их самостоятельной работы. Прежде всего, это проблема вариативности устной речи от одного носителя национального языка к другому и тесно связанная с ней проблема самостоятельного тестирования обучаемыми качества своего произношения.
Налицо очевидное противоречие в самой постановке задачи: обучаемый с недостаточной на данный момент языковой подготовкой и ограниченными возможностями в будущем в процессе самообучения должен приблизиться по своему произношению к некоторому эталону, который он слабо себе представляет (плохо слышит). Указанное противоречие может быть преодолено на основе визуализации степени рассогласования произношения обучаемого по отношению к соответствующему речевому сигналу-эталону.
Наиболее распространенным способом визуализации данных в известных разработках, таких как, например, последняя разработка IBM - «Видимая речь-III», являются временные диаграммы и/или частотные спектры речевых сигналов. Однако здесь возникает еще одна, может быть, наиболее острая, проблема: многокритериальности качества речи. Спектры сравниваемых сигналов могут быть близкими друг другу на одних частотах, и при этом сильно разниться на других. Добиться близости спектров речевых сигналов одновременно на всех участках (формантах) речевого диапазона частот (4 кГц) в процессе постановки произношения – это практически (теоретически, по-видимому, тоже) не разрешимая проблема. Именно указанным обстоятельством объясняется тот общеизвестный факт, что современные IT-методики обучения речи и языкам до настоящего времени не находят в мире действительно широкого применения несмотря на очевидный спрос и их гуманитарную значимость.
Указанный недостаток принципиально отсутствует в новой системе визуализации речевых сигналов на основе информационной теории восприятия речи (ИТВР). Ее строгое математическое обоснование было впервые дано в работах авторского коллектива в рамках проекта РФФИ 07-07-12042-офи. Краткий перечень опубликованных авторами работ представлен в п. 4.6.
В отличие от всех известных своих аналогов предлагаемый подход основывается на визуализации речевых сигналов в информационной метрике Кульбака-Лейблера, а процедура самообучения сводится к оптимизации произношения самими слабослышащими по единственному (!) критерию: минимума информационного рассогласования (МИР). При этом достижимость эталонного произношения обеспечивается использованием не одного, а целой группы «эталонов», включающей в себя и лучшие образцы произнесений от группы слабослышащих, успешно прошедших ранее обучение.
Круг потенциальных пользователей предлагаемой информационной системы охватывает как армию частных (физических) лиц, испытывающих острые потребности в постановке или улучшении своего произношения (по существующим оценкам это почти 10% от населения страны), так и многочисленные коллективные центры психолого-социального сопровождения слабослышащих детей и подростков, такие как Общество ГЛАГОЛ, г. Нижний Новгород.
Современное состояние обучения речи и постановки произношения на родном и иностранных языках у детей и подростков с нарушениями слуховых функций характеризуется разнообразным использованием компьютерных технологий для оценки качества произношения речи и коррекционных упражнений. Компьютер фиксирует речь как физическое явление: четкость, темп, интонация, скорость и громкость. Обучаемый сравнивает показатели своего голоса с показателями голоса диктора-эталона и корректирует свое произношение в ту или иную сторону. При этом основные направления совершенствования в области речевых технологий основываются на визуализации речевых сигналов, точнее, степени их рассогласования. Визуализация речи представляет собой отображение речевого сигнала на экране монитора в наглядной для пользователя форме. Сигнал может быть представлен в виде графиков во временной и/или частотной области, различного рода мультипликаций и т.п.
На данный момент существует несколько десятков программно-аппаратных комплексов, направленных на визуализацию и обработку речевых сигналов. Перечень наиболее распространенных из них приведен ниже.

«Речевой калейдоскоп» 5500-5600, $ НПО "КАСКОД" С-Петербург Программно-аппаратный комплекс; предназначен для профессиональной работы логопеда. В состав входит персональный компьютер и ПО

«Видимая речь-III» 2600-3150, $ Фирма IBM Программно-аппаратный комплекс;
предназначен для коррекционно-развивающей работы с детьми, имеющими нарушения звукопроизношения, голосообразования, слуха, нарушения сенсомоторных функций речи

«Дэльфа-130» 200-230, $ Предприятие Дэльфа - г. Москва Программный пакет;
предназначен для выработки и закрепления навыков правильного произношения, а также формирования речи у глухонемых и слабослышащих

«Русская фонетика» 100-150, $ Фирма IstraSoft Программный пакет; предназначен для изучения и постановки правильного произношения русского языка

Наиболее популярным из них является программный продукт IBM «Видимая речь-III». Еще в 1989 году фирма IBM на базе компьютера собственного производства первой решила задачу технической поддержки работы по постановке произношения, создав программно-аппаратный комплекс «Видимая речь, версия 1.0». Существующая на сегодня третья версия программы включает в себя 14 модулей, которые позволяют работать как с детьми, так и с взрослыми пациентами. Идея визуального контроля речи и игровой принцип работы позволяет в несколько раз ускорить работу по формированию речевых навыков.
Программно-аппаратный комплекс ориентирован на широкий круг лиц, испытывающих те или иные проблемы в формировании речевых навыков. По мнению авторов программы, возрастной диапазон ее “пользователей” может колебаться от 2 до 20 лет. Действительно, характер изображения в первых блоках модулей адекватен дошкольному и среднему школьному возрасту, а последние два блока, базирующиеся на различного рода графиках, позволяют работать с подростками и взрослыми. В блоке распознавания фонем происходит анализ и сравнение произнесённой фонемы с эталоном, который записан в словаре диктором.
В отличие от указанных выше программных продуктов информационная система и методика обучения речи и постановки произношения на основе ИТВР гарантирует достижимость эталонного произношения благодаря использованию не одного, а целой группы «эталонов», включающей в себя и лучшие образцы произнесений от группы слабослышащих, успешно прошедших обучение ранее. Одновременно преодолевается острейшая проблема многокритериальности качества устной речи. Эффективность предлагаемого подхода показана на ряде примеров из практики автоматической обработки речи.

Состояние проекта
Основным результатом работ по проекту будет новая система аппаратных и программных средств для обучения речи глухонемых и слабослышащих, в частности, детей и подростков с ограниченными слуховыми возможностями, в режиме самообучения на основе принципов и методологии информационной теории восприятия речи с автоматической визуализацией речевых сигналов.
Планом на второй (заключительный) этап работы по проекту была предусмотрена разработка и апробация новой методики обучения речи и постановки произношения у слабослышащих на основе новой информационной системы.
Базовая модификация (или пилотный проект) информационной системы обучения речи (ИСОР) была разработана и апробирована в лабораторных и натурных условиях в процессе выполнения работ по плану первого этапа. Важнейшим результатом проведенной апробации явился вывод о высокой эффективности разработанной ИСОР и одновременно – о целесообразности введения в ее режимы работы и в методику обучения речи глухонемых и слабослышащих наряду с фонетическим уровнем второго, морфологического уровня обучения. А это потребует определенных дополнений в базовую модификацию ИСОР.

Таким образом, работа над проектом в 2010 г. имеет два взаимосвязанных направления:
- разработка новой модификации ИСОР в расчете на обучение глухонемых и слабослышащих не только элементарным звукам типа отдельных фонем, но и их распространенным сочетаниям: двузвучиям, трезвучиям и т.д., или морфемам, вплоть до отдельных слов и целых фраз;
- разработка новой методики и технологии обучения речи глухонемых и слабослышащих на базе новой модификации ИСОР.
Стоит отметить, что в принципиальном отношении разработанная по плану первого этапа базовая модификация ИСОР может быть адаптирована для обучения как звуковому строю языка, так и контекстному произношению фонем в потоке слитной речи - без существенных изменений своей архитектуры и интерфейса. Даже схема (технология) обучения на базе ИСОР остается неизменной: в обоих режимах «траектория обучения» слабослышащих имеет форму «улитки» или скручивающейся спирали с центром в точке отображения на плоскости информационного эталона изучаемого звукосочетания. Меняется лишь содержание эталонной базы данных: вместо отдельных звуков-фонем в нее войдут звукосочетания, слова и даже короткие фразы. При этом достижимость эталонного произношения гарантируется, как и ранее, использованием не одного, а целой группы «эталонов», включающей в себя и образцы морфем от части дикторов из числа слабослышащих, успешно прошедших обучение на фонетическом уровне. Критерий МИР в принципиальном отношении также не изменится: в нем в качестве величины информационного рассогласования по слову целиком будет использована суммарная величина информационного рассогласования в смысле Кульбака-Лейблера по группе всех фонем данного слова. В таком случае фонетический анализ, или выделение из слитной речи всего списка используемых в ней фонем – важнейшая дополнительная часть автоматической обработки сигналов в ИСОР при обучении речи на морфологическом уровне.
Еще одно дополнение в обработку сигналов – это стандартная (по методу динамического программирования) процедура выравнивания темпа речи диктора-обучаемого и диктора-эталона. И фонетический анализ речи, и процедура динамического выравнивания слов – ключевые элементы информационной теории обучения, созданной в рамках настоящего проекта на первом этапе работ.
Поэтому работа по проекту на его заключительном этапе основывается, главным образом, на разработанной ранее методологии ИТОР и сводится к решению последовательности конкретных задач:
1. Разработка алгоритма фонетического анализа слитной речи в режиме реального времени на основе нового математического аппарата информационной теории обучения;
2. Разработка алгоритма динамического выравнивания слов по критерию МИР для системы обучения речи на морфологическом уровне;
3. Разработка новой модификации информационной системы обучения речи (ИСОР-2) в расчете на двухуровневую технологию обучения: звуковому строю языка и контекстному (морфологическому) произношению;
4. Проведение лабораторных испытаний и апробация в лабораторных условиях опытного образца ИСОР-2;
5. Разработка новой методики и технологии обучения речи глухонемых и слабослышащих на основе применения ИСОР-2;
6. Постановка и проведение заключительных натурных испытаний и практическая апробация опытного образца ИСОР-2 в условиях специнтерната для детей и подростков с врожденными дефектами речи (г Нижний Новгород).
К числу перспективных направлений развития информационной теории обучения речи относятся, прежде всего, проблемы обучения иностранным языкам. В частности, при учете строгого, теоретико-информационного, определения эталона речевого сигнала и геометрической интерпретации на рис.1 информационной системы и новой технологии обучения речи с визуализацией данных может быть доказано утверждение: при обучении иностранному языку одного учителя не достаточно. (Напрашивается пример обычной средней школы). Не достаточно и двух разных учителей. Три учителя на каждого ученика (или учебную группу) – это минимум, гарантирующий приемлемое усвоение разговорного языка, особенно на начальном этапе обучения. И в общем случае: чем больше учителей, тем лучше усваивается язык в условиях любого ограниченного срока обучения. (Второй очевидный пример в подтверждение сказанному – общеизвестная роль практики общения обучаемого с носителями языка в естественных условиях).
Не менее интересен вопрос и по количественному (и качественному) составу учебных групп. Здесь также имеется оптимум, причем совсем не тривиальный: один учащийся в группе – далеко не лучший вариант.
Документы

Ключевые экономические показатели

  1. Срок реализации - 1,5 год(а)/лет
  2. Срок окупаемости - 1 год(а)/лет
  3. Доходность на средства акционеров (ROI) - 50 % в год
  4. Внутренняя норма рентабельности (IRR) - 40 % в год

Корпоративная структура

Новая компания по производству и продажам новой техники и технологий обучения речи

Маркетинг

Собственные исследования

Управление проектом

Совместно с инвестором

Дополнительная информация

Проект относится к области инновационных технологий постановки произношения, обучения речи и тестирования качества разговорного языка. Ничего подобного по характеристикам на данный момент в мире не существует.

Контактная информация



Комментировать могут только зарегистрированные пользователи!