Рисунок: Дмитрий Петров / "Солидарность"
Работа профсоюза - это в первую очередь работа с информацией. Любые переговоры, подготовка новых нормативных актов, юридическая защита прав трудящихся подразумевают эффективный и законный сбор информации и ее обработку. О том, где и как качественно найти нужные сведения, обработать их и правильно использовать, “Солидарность” расспросила экспертов в анализе данных и конкурентной разведке.
“Всякий экспромт хорош, когда он хорошо подготовлен”. Слова эти приписывают юмористу Аркадию Райкину. И оправданно: его экспромты были удачными, потому что артист живо интересовался всем, что происходит в стране и мире, и умел вовремя применять свои знания для искрометных шуток.
В принципе, это портрет идеального профсоюзного активиста, поскольку вся его работа - непрерывные переговоры разной степени сложности, подготовка мероприятий, “разруливание” проблем, возникающих в коллективах, а то и чьих-то личных неурядиц. Эффективно эти задачи можно решить, только если постоянно собирать, обрабатывать и своевременно использовать самую разную информацию. Причем свою роль в успехе переговоров может сыграть каждая мелочь.
Например, при подготовке Ялтинской конференции советские специалисты учли буквально всё. Так, для президента США Рузвельта, который не мог самостоятельно передвигаться, были подготовлены удобные апартаменты в Ливадийском дворце и удобная кровать. Учли даже его цветовые пристрастия - шторы, телефоны, плитка в ванной были его любимого голубого цвета. Кстати, по итогам конференции различные государственные награды получили 294 повара и официанта. Как раз за то, что учитывали каждую мелочь и кулинарные пристрастия участников.
Все это стало возможным благодаря заблаговременному сбору информации, что блестяще проделали советские разведчики и дипломаты. Огромное количество информации было получено легально, из открытых источников.
Как и любое другое дело, сбор информации начинается с подготовки, правильной постановки вопросов и формулировки ясных и четких ответов на них.
Начать стоит с объекта, о котором вы хотите собрать данные. Сформулируйте, о чем или о ком вы собираетесь искать информацию и в каком качестве вас занимает объект интереса. Вы хотите подробнее узнать о деятельности организации, которая предлагает вашему профсоюзу совместные действия? Хотите уточнить семейное положение членов профсоюза, чтобы сделать им сюрприз к новогодним праздникам? Или задача поделикатней - узнать рабочий и политический бэкграунд нового соцпартнера?
Определив объект интереса и его характеристики, вы получите более точное представление о том, какие данные нужны в первую очередь. Однако не стоит слишком сужать поле поиска (излишне расширять тоже не стоит).
Обратите внимание на важный момент: любой сбор информации - это “подергивание за ниточки с колокольчиками”, то есть дело крайне деликатное. Оно может вызвать непредсказуемую реакцию человека, о котором начат сбор данных. Ваш интерес может быть невинным - но как его интерпретируют? Вспомните о незавидной участи шантажиста из рассказа Артура Конан Дойла “Конец Чарльза Огастеса Милвертона”.
Наконец продумайте, как вы собираетесь использовать полученную информацию. Здесь есть ряд тонких моментов.
- В законодательстве точно указаны основания для обработки данных. Для полиции они одни, для журналистов совсем иные, - рассказывает член генсовета “Деловой России”, руководитель подкомитета по противодействию информационно-телекоммуникационным правонарушениям Евгений Елфимов. - Физические лица и вовсе не имеют прав на то, чтобы законно кого-то “пробивать”. Конечно, если вы информацию собираете для себя лично - проблем не будет, кроме случаев незаконного доступа к конфиденциальным сведениям (к гостайне например); закон будет рассматривать сбор данных как неотъемлемую часть мыслительной деятельности человека. Но как только вы начинаете данные продавать или передавать - идите регистрироваться в качестве оператора персональных данных.
- Важно помнить, - уточняет эксперт, - что, даже работая с открытыми данными, можно неожиданно получить информацию, имеющую гриф секретности. Тщательно оценивайте, что и для чего, а особенно для кого вы собираете или анализируете.
Определившись с вопросом “зачем”, можно приступать к поиску ответов на вопросы “что”, “где” и “как”. Сразу оговоримся: речь идет только о работе с так называемыми открытыми источниками, к которым законно может получить доступ любой желающий.
- Законно сейчас можно получить любую информацию, которую человек либо организация сообщили о себе сами. Например, при заполнении профиля в соцсети люди выкладывают о себе много информации: номер телефона, электронный адрес, возраст, профессию, - говорит генеральный директор аналитического агентства “Стратегия Восток-Запад” Дмитрий Орлов. И добавляет: - Кроме того, в России доступны открытые базы 10 федеральных ведомств. Там можно узнать, в розыске ли человек, проверить, действителен ли у него паспорт, есть ли на человека исполнительные производства, судился ли он с кем-нибудь.
О физических лицах и их частной жизни вам исчерпывающе расскажут социальные сети. Часть информации можно получить, даже если пользователь закрыл профиль.
- В Конституции РФ закреплена неприкосновенность частной жизни, личной и семейной тайны, а также тайна переписки. В федеральном законодательстве, в частности в 152-ФЗ “О персональных данных”, подробно раскрыто, как можно и как нельзя собирать персональные данные и что к ним относится. В частности, нельзя осуществлять автоматизированный сбор (парсинг) персональных данных с интернет-ресурсов, - раскрывает тонкости правил сбора информации замдекана по молодежной науке РГУ нефти и газа (НИУ) им. И.М. Губкина, преподаватель дисциплины “Анализ данных цифрового следа” Дмитрий Медведев.
Однако, уточняет Медведев, “определенная, условно техническая, информация, например адрес электронной почты или никнейм, не относится к персональным данным: их сбор и обработка, даже автоматизированные, не запрещены. Между тем довольно часто один и тот же никнейм человек несет за собой долгие годы, и это сетевое имя накапливает разнородную информацию о хозяине”.
А по мнению Елфимова, если сопоставить публичные данные (например, данные государственных автоматизированных систем и сервисов, публичных реестров, баз данных, открытых источников, таких как коммерческие реестры, решения судов, общественные декларации) и данные, которые человек сам предоставляет о себе при заполнении анкет, официальных форм, социальных аккаунтов, блогов, сайтов, а также в рамках общественных мероприятий или публичных выступлений, то “мы уже можем получать почти все то, что получают сотрудники спецслужб”.
Правда, напоминает Дмитрий Орлов, если вы хотите действительно качественно собрать информацию, то останавливаться только на том, что доступно в Сети, не стоит:
- Самый главный миф Глобальной сети звучит так: “В интернете есть всё”. На самом деле еще лет 15 назад американские специалисты обнаружили, что интернет содержит всего 40% имеющейся в мире информации. То, что вас интересует, вы можете и не найти в открытых или условно открытых источниках.
Так что если есть возможность “поговорить по душам” с человеком, который может дать вам интересующую информацию, не пренебрегайте этим “допотопным” способом.
Хотя все больше людей выкладывают о себе столько информации в открытый доступ, что даже беглый просмотр профиля в соцсети может дать исчерпывающее представление о человеке. Об этом рассказывает Дмитрий Медведев:
- Особенно хочу выделить молодое поколение, в возрасте 20 - 30 лет, так как это первое поколение тех, кто родился в эпоху социальных сетей и с 10 - 12 лет размещает гигабайты информации о себе, своих увлечениях, активностях. При этом, начиная профессиональную деятельность сейчас, уже ощущают невозможность скрыть весь массив созданного контента. Пример - вчерашний студент, который ведет социальные сети под ником alcogolic, радостно отмечая себя на фотографиях с вечеринок, пытается устроиться на работу в некое федеральное агентство, которое при проверке анкеты вычисляет его привычки - даже при том, что он скрывает страницу и меняет повсюду ФИО.
Для нужд “бытовой разведки” обычному человеку, который хочет узнать, скажем, отзывы о работодателе, социальном партнере или кандидате на должность в профкоме, в принципе, достаточно двух основных инструментов - поисковой системы и соцсетей. В этом случае важнее даже не количество и мощь инструментов, а умение задавать правильные вопросы. Недаром Евгений Елфимов рекомендует учебник Виноградова для средней школы “Логика” от 1954 года: “До сих пор это лучшее пособие для выработки принципов и методов работы с данными”.
Вместе с тем эффективность возрастает в разы, если знать и применять так называемые операторы поиска. Как говорит Дмитрий Орлов, “любые поисковики настроены так, что индексируют абсолютно всю найденную информацию. А “операторы поиска” найдут все или почти все, что вам нужно. К примеру, определенные строки текста внутри страниц веб-сайта или файлы, размещенные по конкретному URL-адресу”.
Кроме того существует огромное количество специализированных инструментов поиска и сбора информации, доступ к которым может получить практически любой.
- Инструментов для сбора данных по открытым источникам огромное количество. Когда мы попытались их категорировать, то обнаружили, что только видов (!) инструментов OSINT (см. в справке. - Прим. ред.) существует более 30. И в каждой категории более 100 инструментов и приложений. При этом инструменты еще делятся по странам или регионам обрабатываемых данных, - рассказывает Дмитрий Медведев. И уточняет: - Сейчас я говорю о методах сбора и первичной систематизации. Если добавить инструменты так называемой вторичной аналитики, например социальные графы, карты связей, то количество увеличится еще двукратно.
“Заточенность” инструмента на определенный сегмент интернета - важное обстоятельство, которое необходимо учитывать при выборе. Евгений Елфимов, компания которого разрабатывает программный комплекс “Охотник”, подчеркивает: “Охотник” был сделан с акцентом на сегмент СНГ и включает уникальные модули, которых нет вообще в мире. Например, нейросети, которые позволяют машине “думать” за оператора, позволяя значительно повышать скорость и эффективность расследований”.
В любом случае, выбирая инструмент, надо отталкиваться от того, какая информация вам нужна и как вы собираетесь ее обрабатывать и систематизировать.
- Например, почти в каждой стране есть огромные онлайн-фотобанки административных зданий, мостов, дорог, рек и т.д. Существуют системы автоматизированного поиска уникальных сочетаний объектов. Например, в Openstreetmap формулируются запросы примерно следующим образом: “Покажите мне все места в этом регионе/городе, где в 20 - 50 м от желтого трехэтажного здания стоит лавочка, примерно трехметровая, а слева светофор и пешеходный переход”, - рассказывает Медведев.
Опытом работы с различными инструментами делится и Дмитрий Орлов:
- Если вы хотите узнать что-то о пользователе Сети и знаете его никнейм, то обратитесь к Check Usernames. Славен он тем, что помогает быстро получить любую информацию об именах пользователей. Делает он это одновременно по 150 с лишним веб-сайтам. Еще один хороший ресурс - WebMii: ищет людей по имени, фамилии, стране проживания. Ему можно также задавать дополнительные фильтры, например возраст.
Надо сказать, что в последнее время все более заметным трендом становится использование искусственного интеллекта при сборе и анализе информации. Так, недавно журналисты “Нью-Йорк таймс” использовали ИИ при анализе находящихся в открытом доступе спутниковых снимков сектора Газа. Сначала ИИ нашел журналистам все потенциально подходящие им объекты, затем журналисты отсеяли “ложные срабатывания” вручную.
Объем сведений, доступный любому желающему фактически о любом человеке или организации, увеличивается постоянно. И сегодня наиболее остро стоит, пожалуй, вопрос как раз обработки и анализа полученной информации и умения ее правильно применять. Техника, конечно, в этом тоже может помочь. Но для этого человек должен сам себе корректно поставить задачу, как он будет информацию обрабатывать.
Основных методов два: количественный анализ и качественный.
В первом случае инструментарий огромен, от элементарного Excel и его аналогов и до сложных, продвинутых, многофункциональных систем - все зависит от вашего бюджета.
- Что касается систематизации, то если денег у вас немного, лучше всего создавать базы данных с помощью бесплатных программ типа Access для Microsoft или LibreOffice Base для Linux, - советует Орлов.
Если же речь заходит о качественном анализе, то основным инструментом становится голова аналитика и уровень владения методами анализа.
- Самые простые методы - это дедукция и индукция (анализ от общего к частному или от частного к общему), кластерный, эвристический и графовый анализ, - рассказывает Евгений Елфимов. - Самое главное в том, чтобы обучить машину эффективно распознавать собираемую информацию, приводить ее к “реляции” (от англ. relations - отношение, связь. - Прим. ред.). Тогда она сможет создавать очень красивые заключения.
А вот как интерпретировать полученные заключения, зависит только от уровня профессионализма человека, на стол которому ложатся обработанные данные.
Как напоминает Елфимов, “не так давно ООН признала невозможность проконтролировать или ограничить сбор данных пользователей ИТ-компаниями”. Сейчас к ним все активнее присоединяется и государство, например через сайты госуслуг.
У некоторых людей это вызывает вполне оправданный дискомфорт. Кое-кто вспоминает и о “грехах молодости”, вроде вышеупомянутого ника alcogolic. Возникает желание удалить всю информацию о себе, начать с чистого листа. Возможно ли это? Тем более что в Сети можно найти и рекламу компаний и специалистов, предлагающих такие услуги.
Увы, ответ - нет.
- Информацию, размещенную однажды в интернете, удалить крайне сложно, особенно - не имея на это законных оснований. Например, возможности использовать так называемое “право на забвение”, то есть удаление из публичного доступа некорректно или нелегально размещенной там информации, - говорит Дмитрий Медведев.
Добавим, что такая попытка со стороны более-менее публичной персоны сама по себе может привлечь ненужное внимание.
А вот затруднить сбор информации о себе - можно:
- Для начала поинтересуйтесь, что о вас знает “Яндекс” или другой поисковик, - советует Дмитрий Орлов. - Вводите свою фамилию и имя на русском или другом языке, а потом - ищете по адресам электронной почты и номерам телефонов, которыми вы пользуетесь. По крайней мере будете знать, какие сайты имеют доступ к вашим личным данным и какая информация к ним привязана.
Также специалист советует завести для регистраций в магазинах и сервисах отдельный почтовый ящик и номер мобильного телефона. И не использовать их ни для чего другого.
Однако лучший, пожалуй, совет - заранее быть готовым к тому, что информацию о вас в какой-то момент обязательно начнут собирать. Так что всегда и везде надо руководствоваться принципом: все, что я говорю и делаю, может стать публичным.
Непросто - зато эффективно.
Методы сбора и анализа открытых данных
OSINT (Open Sourсe Intelligence) - сбор данных по открытым источникам.
GEOINT - геопространственная разведка по открытым источникам, вычисление местоположения человека или объекта по фото.
HUMINT - получение информации в ходе общения с людьми. Как правило, осуществляется с помощью специальных приемов и отработанных навыков общения.
ADINT - получение информации по рекламным модулям и меткам. Такие метки присваивают, “вешают на пользователя” рекламные системы, чтобы отслеживать его перемещение по сети.
Чтобы оставить комментарий войдите или зарегистрируйтесь на сайте
Чтобы оставить комментарий войдите или зарегистрируйтесь на сайте
Если вам не пришло письмо со ссылкой на активацию профиля, вы можете запросить его повторно