Эксперт Компании ЭГО Транслейтинг выступила на ведущей российской конференции по ИИ

20-21 февраля 2020г. в Москве состоялась крупнейшая российская открытая конференция по искусственному интеллекту OpenTalks.AI. В конференции приняли участие более 1,500 специалистов из разных областей ИИ; доклады представили свыше 50 экспертов ведущих российских и зарубежных компаний, среди которых Huawei, IBM, МТС, Сбербанк, Samsung, Intel, Brand Analytics, Philips, Цифра, Datana и многие другие.

Программа конференции включала четыре тематических блока. В рамках блока «NLP & Speech recognition/synthesis» 20 февраля R&D директор Компании ЭГО Транслейтинг Елизавета Иванова представила доклад «Обработка данных для обучения нейросети на примере машинного перевода» с презентацией разработок Компании.

По данным ВШЭ, к 2025 году 80% данных будут не структурированы. Ключевым вопросом в области больших данных становится поиск решений для получения «ценных данных».

Указанная проблематика относится и к многоязычным текстовым корпусам, используемым в переводческой отрасли. На помощь приходят технологии, решающие вопросы сбора, нормализации, очистки данных, единства терминологии и многого другого. Основными требованиями являются объем от 100 000 предложений, верная терминология, полнота и деперсонализация. Очищенные и нормализованные данные – основа для обучения нейросети и корректного машинного перевода

ЭГО Транслейтинг активно занимается разработкой решений для переводческой отрасли, предлагая программные продукты на платформе EGOTECH по обработке и нормализации данных. В результате применения наших решений качество перевода повышается до 50%. При этом ключевым аспектом качества является правильная терминология.



Источник: m.vk.com