Американский ученый разработал компьютерную программу для перевода химических формул на 13 языков. Статья с описанием работы нового алгоритма опубликована в журнале Journal of Chemical Information and Modeling.
Автор алгоритма проверил его эффективность для 250 тысяч различных химических соединений. Программа безошибочно перевела названия веществ в 98 процентах случаев.
До сих пор перевод названий химических соединений на различные языки не был автоматизирован. Грамотно выполнять эту задачу могли только профессиональные химики, владеющие несколькими языками. Трудность заключается в особенностях химического языка. Наиболее общепринятая номенклатура ИЮПАК предполагает, что значение имеют не только сами слова, но также пробелы и дефисы между ними. Для того чтобы обозначить, например, стереохимические особенности веществ, перед названиями некоторых из них ставятся латинские буквы. Прописная и строчная буквы имеют разное значение.
Автор указывает, что необходимость точного перевода названий химических соединений существует. Большая часть информации о тех или иных веществах представлена на английском языке. Однако сравнимое количество данных опубликовано на китайском. Доля других языков заметно меньше, но также существенна. Для того чтобы получить наиболее полную информацию о соединении часто необходимо искать ее на разных языках.
Кроме того, во многих странах нормы, регламентирующие получение патентов на фармакологические и биотехнологические препараты требуют, чтобы информация о них была представлена на языке той страны, где будет выдан патент.