Автозамена в популярной офисной электронной таблице привела к тому, что многие названия генов были заменены на даты.
Ученые проанализировали тысячи статей по генетике, опубликованные за последние 10 лет, и пришли к выводу, что почти в каждой пятой публикации встречаются опечатки в названиях генов, связанные с настройками по умолчанию в Excel. Программа автоматически изменяла названия генов на даты или числа с плавающей точкой.
Каждому хотя бы раз приходилось бороться с автозаменой, настойчиво предлагающей более распространенное слово. У генетиков похожие проблемы: названия генов, похожие на даты (например, SEPT2 или MARCH1) или на числа с плавающей точкой (например, 2310009E13), редактор таблиц Microsoft Excel с настройками по умолчанию автоматически переводит в другой формат.
Чтобы оценить распространенность опечаток, ученые проанализировали 35175 электронных таблиц Excel из 3597 научных публикаций, вышедших в 19 научных журналах с 2005 по 2015 год. В 704 из них нашлись опечатки в названиях генов, связанные с автоформатированием.
Поскольку полностью отключить эту опцию нельзя ни в Excel, ни в бесплатных аналогах LibreOffice Calc и Apache OpenOffice Calc, авторы статьи рекомендуют ученым задавать формат данных вручную.