Можно ли исключить из рассмотрения источник, содержимое которого невозможно прочитать
Хотя в электронной цифровой форме сегодня может быть представлена практически любая информация, для исследователя международных отношений наиболее актуальны текстовые, звуковые и визуальные источники. Все они являются машиночитаемыми. Это означает, что информация, содержащаяся в них, не может быть воспринята человеком непосредственно; для извлечения информации из этих источников необходимы технические приспособления: компьютерная техника и программное обеспечение, способное обрабатывать информационные объекты, созданные при помощи различных технологий обработки информации.
Технологии обработки информации, её перевода в цифровой вид, записи и хранения на электронных носителях создавались и создаются в разных точках Земли, различными исследовательскими коллективами, академическими группами, коммерческими разработчиками, общественными организациями и отдельными лицами. В результате существует немалое количество стандартов электронных документов, для работы с которыми необходимы самые разные компьютерные программы. Некоторые стандарты признаются на международном уровне; их рекомендуют к использованию авторитетные международные организации: Международная организация стандартизации (ИСО), Международный союз электросвязи (МСЭ), Международная электротехническая комиссия (МЭК). Так, например, разработанный корпорацией «Adobe» стандарт электронного представления текстовой и графической информации PDF (portable document format) является официальным стандартом электронного документа, утверждённым ИСО и получившим по классификации стандартов этой организации номер ISO 32000. Этот стандарт широко используется во всём мире. Основанные на нём электронные документы можно в огромных количествах найти как во всемирной паутине, так и в файлообменных сетях. И найти компьютерные программы, отображающие электронные документы, созданные на основе этого стандарта, не составляет труда.
Иногда при наличии официально признанных международных стандартов стандартами де-факто становятся технологии, альтернативные им. Например, если исследователь, не ориентирующийся в современных информационных технологиях, но имеющий чёткое представление о системе международных стандартов, планирует использовать при разработке своей темы электронную переписку с участниками и очевидцами интересующих его событий, ему может прийти в голову использование программного обеспечения для обработки, передачи и приёма электронной почты, основанного на стандарте X.400, разработанном и принятом для этих целей Международным союзом электросвязи. Но при поиске такого программного обеспечения он столкнётся с существенными трудностями. А если и найдёт — выяснится, что аналогичных программ нет у его потенциальных респондентов. Дело в том, что передача и обработка почты на основе этих стандартов практикуется в основном в правительственной, межправительственной и банковской переписке. Частными лицами во всём мире используются в этих целях протоколы SMTP и POP3, менее надёжные и безопасные, не утверждённые уполномоченными организациями в качестве международных стандартов, но фактически являющиеся таковыми на общемировом уровне. Соответственно, исследователю необходимо использовать программу, которая работает именно с этими стандартами передачи и получения информации.
Кроме таких общемировых стандартов информационных технологий, используемых для создания электронных документов и работы с ними, существуют и региональные стандарты (например, в европейском регионе разработкой таких стандартов, а также их продвижением на общемировой уровень занимаются такие организации, как Европейский комитет стандартизации, Европейский комитет стандартизации решений в электротехнике и Европейский институт стандартизации в области сетевой инфраструктуры. Последняя организация разрабатывает и активно внедряет так называемую Систему стандартов информационного общества).
Свои стандарты создания и обработки электронных источников информации могут существовать в разных странах и быть утверждёнными соответствующими институтами на национальном уровне.
Наконец, оригинальные стандарты кодирования и декодирования информации могут использоваться в коммерческих программных продуктах, в корпоративных информационных системах и просто в определённых социальных кругах. Например, исследователь не может игнорировать ни файлы, созданные при помощи пакета программ «Microsoft Office», хотя многие технологии представления информации в электронном виде, используемые в этих программах, не только не признаны как международные стандарты компетентными международными организациями, но и являются запатентованными, а значит, требуют для легальной работы с ними лицензионного программного обеспечения, которое может стоить немалых денег, ни файловые архивы «TAR» или звуковые файлы «OGG», технологии создания которых, опять же не будучи официальным стандартом хранения информации в электронном виде, активно используются сторонниками идеологии открытых исходных кодов во всём мире. Данные, ценные для исследования международных отношений, могут быть представлены в электронном виде людьми из самых разных стран и социальных групп, имеющими доступ к самым разным (иногда очень специфическим) информационным технологиям и программным продуктам, и исследователю в наши дни необходимо иметь хотя бы общее представление о том, как обрабатывать данные, представленные в разных электронных форматах.
Для извлечения информации из любого цифрового источника необходимо устройство, способное преобразовать информацию из машиночитаемой формы в форму, пригодную для восприятия человеком. На сегодняшний день такой функциональностью обладают многие устройства: от стационарного компьютера до мобильного телефона. Мы не будем останавливаться на сложных технологиях преобразования информации. Специалистами в области компьютерных наук в последние годы написано немало пособий по этим вопросам. Остановимся на кратком описании тех современных решений, не требующих знания технических тонкостей работы с электронными документами, которые в первую очередь необходимы исследователю-международнику, получающему информацию из разных стран, и обрабатывающему эту информацию на разных устройствах, одни из которых могут находиться дома, другие — в тех или иных организациях, в пунктах общественного доступа в интернет и т.п., — в общем, там, где исследователю, работающему с оперативными сведениями, необходимо их получить и обработать. Нельзя не учитывать и то, что работа с электронными источниками в общественных науках не может заменить полевых исследований. Поэтому некоторые устройства могут находиться и за границей — в странах, процессы в которых исследуются.
Информация к исследователю-международнику поступает на разных языках. Если в электронных цифровых источниках содержится информация на иностранных языках в звуковой форме, исследователю необходимо владеть этими языками для её извлечения. Если данный конкретный исследователь не владеет тем или иным языком, необходимым для извлечения ценной для исследуемой темы информации из электронного цифрового источника, значит, исследование такой темы имеет смысл проводить исследовательскому коллективу, в котором найдутся люди, владеющие разными языками. Если же в иноязычном источнике содержится информация в виде печатного текста, для извлечения этой информации можно воспользоваться технологией электронного перевода. Эта технология реализована как в специальных карманных устройствах, называемых «электронными переводчиками», так и в программном обеспечении для многофункциональных электронных устройств. В общедоступной форме она реализована на крупных серверах глобальной информационной сети. Доступ к этим серверам осуществляется с любого компьютера, подключённого к интернету и оснащённого веб-браузером. Достаточно развитую общедоступную систему электронного перевода, разработку которой ведёт компания «Google», можно найти по адресу <translate.google.com>. Она работает более чем с сотней языков.
Использовать электронные переводчики для извлечения такой информации как нормативно-правовые акты или политические заявления, нельзя. Тонкости формулировок, важные для таких документов, при машинном переводе теряются. Более того, тексты, полученные в результате машинного перевода, не стоит цитировать в академических работах. Предложения часто получаются несогласованными, а о стилистике и говорить не приходится. Современный уровень развития искусственного интеллекта позволяет исследователю, использующему технологию машинного перевода, понять лишь общий смысл той информации, которая содержится в переводимом источнике. Хотя зачастую из-за поливариантности перевода многих слов даже общий смысл отдельных предложений может оставаться не до конца ясным. Для уточнения значения отдельных слов можно воспользоваться электронными словарями — программами, работающими с базами данных, в которых словам одного языка сопоставлены совокупности их значений на других языках. Эти программы, в отличие от электронных переводчиков, не делают за пользователя выбор оптимального варианта перевода слова. Общедоступные электронные словари можно найти через поисковые машины всемирной паутины при помощи простого запроса наподобие «китайско-казахский словарь онлайн». Если таким способом выяснить значение того или иного слова не удаётся (отсутствует общедоступный словарь или в найденных словарях нет искомого слова), можно пойти двумя путями: либо ввести неизвестное слово на иностранном языке как поисковый запрос и при помощи дополнительных опций, предлагаемых поисковыми системами, ограничить результаты поиска документами на родном языке исследователя (если в тексте на таком языке приводится иностранное слово, велика вероятность того, что значение этого слова разъясняется), либо найти электронный словарь, дающий перевод слов незнакомого языка на английский. Таких словарей во всемирной паутине намного больше в силу большей развитости англоязычного сегмента всемирной паутины и большей распространённости английского языка среди её пользователей. Представить себе квалифицированного исследователя международных отношений, не владеющего английским языком, в наши дни сложно.
Технологии машинного перевода исследователю можно применять не только для перевода уже готовых печатных текстов, но и для электронной переписки, другой участник которой не владеет родным языком исследователя, но владеет одним из языков, с которыми работает та или иная система электронного перевода. Для этого достаточно держать в браузере открытой вкладку со страницей системы электронного перевода и перед отправкой каждого сообщения вводить его в эту систему, получать перевод и отправлять уже переведённый текст. Аналогичным образом можно поступать с сообщениями, приходящими от респондента.
Переводить полученные сведения часто приходится не только с одного языка на другой, но и из одного формата в другие. Например, найденный исследователем документ подготовлен в текстовом редакторе Microsoft Word 2007 и имеет расширение «docx», а исследователя (или непосредственно на том компьютере, которым он в данный момент пользуется) нет этой программы. Что же делать? Бежать в ближайший магазин программного обеспечения и покупать несколько копий пакета «Microsoft Office», каждая из которых стоит немалых денег? (Одной копией не обойтись, если работаешь на разных компьютерах.) А что если на чужом компьютере не разрешат установить то или иное программное обеспечение? Проблему решают онлайновые системы конвертирования электронных документов. Наиболее развитая из них доступна по адресу <zamzar.com>. Зайдя на этот сайт, пользователь заполнияет простую форму: выбирает локальный файл, который необходимо переконвертировать (имя файла может содержать только латинские буквы и цифры), определяет конечный формат (например, файл с расширением «docx» можно «перевести» в двадцать различных форматов, среди которых и «doc», и «rtf», и «pdf», и «txt», и «odt», и «html»), сообщает свой адрес электронной почты и должен немного подождать. В итоге пользователю приходит письмо со ссылкой, которая ведёт к файлу в нужном формате. При помощи этого и других подобных конвертеров легко извлекать информацию из источников, для которых на используемом в тот или иной момент устройстве нет средств просмотра и обработки.
Существует множество веб-сайтов, которые, подобно сайту Zamzar.com, могут помочь обрабатывать различную информацию в электронной цифровой форме без необходимости постоянно иметь под рукой компьютер, на котором установлено всё программное обеспечение, требуемое для работы с файлами различных типов. Благодаря им, исследователь может работать со своими данными, находясь в любой точке мира, за любым компьютером, подключённым к интернету.
Для работы с текстами также существует несколько готовых решений. Наиболее полноценные из них доступны по адресам www.zoho.comm>, <<office.live.co>, <docs.google.com>. Все они пытаются имитировать традиционные офисные пакеты и предлагают практически все функциональные возможности, присутствующие в таких пакетах. Но при этом программа не устанавливается на локальный компьютер, работа с документами осуществляется прямо через браузер, а файлы хранятся прямо на сервере. То есть для извлечения информации из таких файлов не нужно никакого специального программного обеспечения. Подойдёт фактически любой компьютер, подключённый к интернету, на котором можно запустить современный браузер.
Средства для обработки электронных таблиц, просмотра и создания презентаций также присутствуют на всех этих сайтах.
Для извлечения информации из аудиозаписей и звуковых файлов на компьютерах, не имеющих специального программного обеспечения, можно пользоваться системами аудио- и видеохостинга, преобразующими файлы в объекты технологии «флеш», которые прослушиваются или просматриваются также в любом современном браузере. Самый крупный аудиохостинг в странах СНГ доступен по адресу <vk.com/audio>, а видеохостинг — по адресу <vk.com/video>. Для использования возможностей этого сайта необходима регистрация на нём. Но требование быть зарегистрированным пользователем даёт возможность, сохраняя файл на этом сервере, избежать предоставления доступа к нему неограниченному кругу лиц, которое может быть запрещено обладателями исключительных прав на используемую исследователем в качестве источника аудио- или видеозапись. На аудио- и видеохостингах, не требующих регистрации, доступ к загруженному файлу получают все, у кого есть доступ к сайту, поскольку пользователь, загрузивший файл на сервер, сам не был авторизован на нём, и предоставить дальнейший доступ к файлу только ему гораздо сложнее из-за проблем с его идентификацией.
Если во всемирной паутине встречается ссылка на некий документ, а сам документ по этой ссылке найти не удаётся, велика вероятность того, что он был там, но в настоящее время удалён. Как извлечь информацию из электронного цифрового источника, который уже не существует? В этом случае полезным может быть инструмент «Wayback Machine», создаваемый общественной организацией «Интернет-архив», которая занимается практическими аспектами проблемы сохранения цифрового наследия. «Wayback Machine» даёт возможность увидеть, как выглядела та или иная веб-страница в определённый момент. К сожалению, в «цифровой библиотеке» «Интернет-архива» сохраняются не все веб-сайты, но всё же есть существенная вероятность, что значимые документы, которые когда-либо были размещены во всемирной паутине, удастся найти. В «Wayback Machine» нужно ввести адрес веб-сайта, на котором располагался нужный документ, а затем выбрать дату и время, когда этот документ мог там находиться, и посмотреть, что на самом деле было доступно по указанному адресу в указанное время.
Сходные возможности предоставляют некоторые поисковые системы. Если поисковая система нашла некий документ, предоставила ссылку на него, а ссылка не привела к нужному документу, иногда можно просмотреть копию найденной веб-страницы, сохранённую на сервере поисковой системы в тот момент, когда эта страница была проиндексирована.
Все эти сервисы работают в веб-браузере. Иногда нужна поддержка технологии «AJAX», иногда — технологии «флеш». Их поддержка есть в большинстве современных браузеров. Если же есть вероятность того, что исследователь получит компьютер с доступом в интернет, на котором не установлен такой браузер, можно воспользоваться портативной версией бесплатного браузера «Mozilla Firefox», которую можно всюду носить с собой на небольшом накопителе информации (например, на карте памяти) и запускать без установки практически на любом современном компьютере. Дистрибутив этого браузера можно найти, например, по адресу <portableapps.com>. Использование этой программы удобно ещё и потому, что она может сохранять сведения об учётных записях на разных серверах (в том числе пароли), и с его помощью авторизация на различных ресурсах с разных компьютеров происходит быстрее и проще, а конфиденциальная информация о веб-сессиях пользователя не сохраняется на тех компьютерах, с которых он выходит в интернет.
Если же на том или ином компьютере не удаётся запустить портативную версию браузера (например, из-за того, что на компьютере не установлена нужная браузеру операционная система), может пригодиться дистрибутив операционной системы, не требующий установки на жёсткий диск компьютера и запускающийся с компакт-диска или карты памяти. Такие дистрибутивы есть у разных операционных систем. Один из таких дистрибутивов, в котором установлен современный браузер, доступен для загрузки по адресу <magos-linux.ru>.
Таким образом, если на первый взгляд информация из электронного источника представляется нечитаемой, во многих случаях можно найти способ извлечь её. Дискриминировать источники по признаку кажущейся «нечитаемости» не следует.