Трое ученых опубликовали в научном журнале Genome Biology статью, где поделились с коллегами неожиданным наблюдением. Оказывается, довольно значительное количество статей по генетике содержит ошибки в названиях генов, вызванные использованием электронных таблиц.
В электронных таблицах Microsoft Excel предусмотрено автоматическое изменение типа и формата данных в ячейке. Таблица распознает определенные типы данных, например, даты или единицы измерения, и при записи содержимого ячейки приводит их к стандартному виду. Ошибки возникают, когда программа принимает название гена за что-то иное. Например, ген Septin-2, который часто сокращенно называется SEPT2, воспринимается таблицей как дата «2 сентября» текущего года и при записи автоматически заменяется на 2-SEPT.
Авторы статьи проанализировали более 35 тысяч публикаций по генетике и установили, что пятая часть статей, в которых используются электронные таблицы Microsoft Excel, содержит подобные ошибки. Они призывают ученых внимательнее проверять введенные в таблицы данные или же использовать для сохранения списков генов другие форматы.