Информатика 7 класс. §17 Системы перевода и распознавания текста
Сегодня, когда мы можем получить доступ к знаниям со всего мира, возникает потребность в быстром автоматизированном переводе. Эту задачу выполняют программы-переводчики.
Переводчики знают особенности построения фраз переводимых языков, грамматические формы, и могут выдать вполне грамотную фразу на вашем родном языке.
Главная трудность автоматического перевода - многозначность слов. Что бы помочь правильно подобрать значение – нужно определить из какой области текст.
Другая проблема – использование нарицательных значений, и фразеологических оборотов.
Для этого программы-переводчики применяют шаблоны фраз. Но всё равно получаются ошибки.
Идея передать перевод «коллективному разуму», которую применял Google не принесла успеха. Переводчик Google предлагал пользователям улучшить перевод и запоминал предложенные варианты. Но нашлось слишком много шутников, которые стали давать фривольные варианты перевода. Известен мем с переводом в Чехии надписи «Берегите голову» как «Не вмажьтесь головой» с матерным словом.
Продвинутые программы перевода позволяют переводчику в удобном интерфейсе проходить последовательно по каждому слову и выводят для каждого слова набор его значений. Пользователю остаётся только щёлкать мышкой на нужном значении.
Есть также полуавтоматические программы – в них вообще может не быть словаря – они запоминают как вы перевели текст, и в следующий раз встречая такое же сочетание слов подставляют ваш вариант.
Для тех, кто знает иностранный язык, но не знает некоторых слов, есть программы – словари. Вы просто подводите мышку к незнакомому слову и программа показывает варианты перевода.
Вообще, надо сказать, что появление бесплатных переводчиков подкосило рынок программ перевода. Большинству людей достаточно корявого перевода, а кто хочет качественную работу – обращается к профессионалам. Количество покупателей упало, и сделало разработку нерентабельной.
* Распознавание текста
Лидером в России является российская программа FineReader. Кроме распознавания она умеет распознавать шрифт, и даже сохраняет форматирование!
Алгоритм распознавания сначала выделяет объекты похожие на фразы, затем разбивает её на отдельные буквы, и на слова.
Затем либо сравнивает каждую букву с эталоном – если тест хорошо напечатан, либо может применять «фонтанное преобразование» метод – при которым анализируются опорные точки схождения элементов, изменения направления, и т.п. «Фонтанное преобразование» может распознать плохо пропечатанный текст, и даже разобрать рукописный текст – для него не важно совпадает ли буква с шаблоном, а важны «опорные точки», которые даже при нетвёрдом почерке обычно у всех одинаковы.
4 views
190
47
2 months ago 00:34:13 25
7 класс. Программное обеспечение
2 months ago 01:48:55 1
Как студент начал работать в Тинькофф? 😲 #программирование #тинькоффбанк #айти #программист
2 months ago 00:26:23 17
Python для ЕГЭ. Функции. 16 задач за 26 минут! Полный бесплатный курс по питону
2 months ago 00:11:45 1
7 коротких советов перед ЕГЭ
2 months ago 00:08:20 20
От первого лица: Школа 2! СЛОМАЛИ КОМПЬЮТЕР УЧИТЕЛЯ в ШКОЛЕ 😳 НОВЕНЬКИЙ в КЛАССЕ | ГЛАЗАМИ ШКОЛЬНИКА
2 months ago 00:26:01 1
Решение всех десятых заданий с сайта ФИПИ
2 months ago 00:05:05 1
Задача 8 из проекта демоверсии ЕГЭ 2024 по информатике решение ручным способом
2 months ago 00:12:54 1
ЕГЭ по информатике. Демоверсия 2025. Задание №7
2 months ago 00:09:49 1
Двоичная арифметика | Информатика 8 класс #7 | Инфоурок
2 months ago 01:10:56 5
[s1 | 2024] Линейная Алгебра, А. И. Трифанов, лекция 6
2 months ago 01:44:00 11
ЕГЭ Информатика Разбор вопросов по 1, 4 номерам. 7 номер Графика Часть 1/2 Запись занятия 2024-09-16
2 months ago 01:16:25 15
[s1 | 2024] Линейная Алгебра, А. И. Трифанов, лекция 5