Ученые записали информацию в ДНК
Специалисты из Великобритании разработали способ хранения данных в ДНК — материале, который может оставаться в сохранности в течение десятков тысяч лет. Новый метод позволит уместить в одной пробирке с ДНК как минимум 100 млн часов видео в высоком разрешении.
Поскольку в мире существует огромное количество цифровой информации, архивисты испытывают проблемы с ее хранением. Жесткие диски стоят дорого и требуют постоянного доступа к электричеству, в то время как не требующие внешних источников питания архивы, например магнитные ленты, сильно страдают с течением времени.
В свою очередь ДНК является надежным способом хранения информации, в чем могли убедиться ученые, когда им удавалось, например, извлечь информацию из останков мамонта, которые пролежали в земле десятки тысяч лет.
Чтение ДНК является простым процессом, в то время как записать в молекулы информацию не представлялось реальным до недавнего времени. Ученые сталкивались с двумя проблемами. Во-первых, они могли использовать только короткие фрагменты ДНК. Во-вторых, при их чтении возникали ошибки.
Доктор Ник Голдман и доктор Эван Бирни из Европейского института биоинформатики решили создать код, который решает эти проблемы.
«Мы разбили код на множество перекрывающихся в обоих направлениях фрагментов с шифрованием информации и сделали схему кодирования, которая позволяет избежать повторений четырех нуклеотидов», — рассказал г-н Бирни.
Ученые взяли сонеты Шекспира (текст), знаменитую речь Мартина Лютера Кинга (MP3), фотографию здания Европейского института биоинформатики и PDF-файл с «Молекулярной структурой нуклеиновых кислот» Уотсона и Крика.
Затем закодировали эту информацию в виде последовательности ДНК с помощью изобретенной модели шифрования, а после этого отправили в американскую компанию Agilent Technologies. Специалисты последней закодировали непосредственно молекулу ДНК и прислали ее обратно в Европейский институт биоинформатики. Когда Ник Голдман и Эван Бирни «прочитали» ДНК, оказалось, что все файлы восстанавливаются без ошибок. То есть информация была успешно и закодирована, и раскодирована.
«В нашей компании полученные зашифрованные данные были синтезированы с помощью ДНК-синтезатора. Это установка, которая занимается как разложением ДНК на компоненты, так и обратным процессом. На выходе получается молекула со строгой последовательностью нуклеиновых кислот, которую можно «прочитать». В специальном растворе ее переслали (физически) обратно в институт, где на ДНК-секвенаторе молекулу «прочитали», то есть расшифровали ее обратно», — рассказал специалист по молекулярной спектроскопии компании Agilent Technologies в России Александр Галкин.
Биофизик, директор инновационного бизнес-инкубатора InCube Максим Годзи говорит, что работа ученых интересна не с точки зрения биологии или молекулярной биологии, а потому, что ученые проработали существенную математическую часть, связанную с шифрованием.
«Они придумали новый способ разбивать информацию, которую хранили в компьютере (текст, картинка и т.д.), и записывать ее особым образом с помощью шифра. Разработанный ими способ шифрования учитывает особенности именно синтеза и чтения ДНК, а также ошибок, которые возникают во время этих процессов. Этот метод позволяет хранить информацию в течение долгого времени, но и запись, и расшифровка будут происходить долго. Синтезирование 100 млн часов информации в молекулах ДНК займет, возможно, год и будет стоить очень дорого», — отметил г-н Годзи.