На 14 марта 2017 года «Талисман» — средство поиска и выявления фиктивных аккаунтов соцсетей, действующих для распространения недостоверной информации, спама, имитации массовой активности.
14 марта 2017 года Институт системного программирования сообщил о создании системы «Талисман», ориентированной на анализ соцсетей.
Технология позволяет искать и анализировать информацию на основе полных и неполных данных, указанных в профилях социальных сетей, социальным связям аккаунтов, подпискам, спискам «френдов» и читателей. В результате анализа определяются демографические атрибуты пользователей:
- возраст,
- семейное положение,
- уровень образования и так далее.
Если значения тех или иных атрибутов не вписываются в создаваемый программным комплексом алгоритм, можно со значительной долей уверенности сделать вывод — выпадающий из схемы профиль социальной сети принадлежит не живому человеку, а создан искусственно. Используя технологию Текстерра, можно вычислить множества ботов, созданных «одной рукой» или контролируемых по одному шаблону-методичке.
Как работает система удержания в полосе с активным подруливанием у современных Renault.
Технология «Талисман» позволяет, на основании анализа неполных данных с использованием информации из социальных сетей, вычислить примерное место базирования пользователя, его принадлежность к определенному социальному слою, приверженность той или иной идеологии, другую полезную информацию.
Источник: www.tadviser.ru
Talisman: платформа для построения интеллектуальных информационно-аналитических систем
Talisman: платформа для построения интеллектуальных информационно-аналитических систем
Talisman – это комплекс взаимосвязанных программных инструментов для автоматизации типовых задач обработки данных, включая их сбор, интеграцию, анализ, хранение и визуализацию. Обеспечивает быструю разработку специализированных многопользовательских интеллектуальных аналитических систем, объединяющих информацию из внутренних баз данных и открытых источников сети Интернет (в том числе из социальных сетей).
Особенности и преимущества
Talisman использует технологии больших данных и передовые методы искусственного интеллекта для извлечения информации из произвольных источников. Позволяет быстро создавать интеллектуальные аналитические системы, используя подходы Low-code и No-code. Постоянно обучается на результатах работы аналитика, не требуя дополнительных трудозатрат.
Talisman – это:
- Широкий набор переиспользуемых компонентов, каждый из которых обладает программным интерфейсом для удобного управления и взаимной интеграции:
- Компоненты для получения исходных данных. В частности, это программный комплекс сбора данных из сети Интернет: из соцсетей (Вконтакте, Facebook, Twitter, Instagram, Одноклассники, Youtube, LinkedIn и др.), блогов, СМИ, сайтов mediawiki, порталов разработчиков ПО и др. Кроме того, есть система импорта данных из файловых хранилищ и СУБД.
- Компоненты автоматического анализа данных. Набор инструментов, позволяющих преобразовать входные данные любых форматов и привести их к единому универсальному представлению (в частности, используется разработка ИСП РАН ¬Dedoc). Документы в этом представлении подвергаются анализу с помощью методов машинного обучения. Имеется возможность добавлять собственные обработчики в виде контейнеров с REST API. Управление последовательностью обработки осуществляется системой «Talisman.Поток» (№6045 в Едином реестре российского ПО).
- Компоненты хранения и индексации. Это группа СУБД и информационно-поисковых систем, где хранятся исходные данные, результаты автоматической обработки, а также результаты работы пользователей.
Области применения
Talisman позволяет создавать аналитические системы для решения широкого круга прикладных задач. Примеры применения:
Талисман операционной системы LINUX #умскул #егэинформатика #викторияланская #егэ2023 #информатика
- Автоматизация построения базы знаний по интересующей предметной области и обеспечение постоянного мониторинга новой информации об объектах интереса (аналог Palantir Gotham).
- Проведение конкурентной разведки по открытым данным (OSINT) с целью поиска сведений по объектам интереса (аналог Maltego).
- Мониторинг СМИ с целью решения аналитических задач (аналог LexisNexis).
- Оптимизация управления персоналом: эффективный подбор сотрудников, верификация анкетных данных, выявление некорректного поведения в открытом информационном пространстве (система «Talisman.Биография», №5547 в Едином реестре российского ПО).
- Выявление информационных кампаний, манипулирующих мнением целевой аудитории, а также определение целевой аудитории, на которую направлена кампания.
- Выявление и анализ особенностей инфраструктуры распространения информации (ресурсы, пользователи, боты), а также анализ типичных ролей членов сообществ в коммуникации (первоисточник, лидер мнения, распространитель, модератор, бот, комментатор).
- Управление деловой репутацией людей и организаций: мониторинг релевантных сообщений, выявление проблем, вызывающих недовольство, мониторинг утечек и разглашения внутренней информации.
- Объективная оценка эффективности деятельности, а также тестирование стратегий на целевой аудитории в целях получения обратной связи.
- Управление точками социального напряжения; обнаружение и своевременное предупреждение эскалации конфликтов.
Поддерживаемые языки
Talisman использует современные искусственные нейронные сети для анализа данных. Используемые инструменты позволяют извлекать информацию более чем из 100 естественных языков.
Схема работы
Разработчик/участник
Источник: www.ispras.ru
Интернет без анонимности: новые технологии ИСП РАН
Технологии “Талисман” и “Текстерра”, разработанные Институтом Системного Программирования РАН, способны изменить лицо глобальной информационной сети Интернет. Предназначенные для анализа больших массивов данных социальных сетей, они были впервые представлены широкой аудитории этой зимой.
“Текстерра” – технология многоязычного интеллектуального анализа текста. В ее основе – программный комплекс, способный накапливать и анализировать информацию, устанавливать взаимосвязь между понятиями и проводить интеллектуальный анализ текстов. При этом “Текстерра” опирается на объем понятий и терминов, почти на порядок превышающий размеры Британской энциклопедии, и может при необходимости расширить свою базу знаний еще больше. В результате при использовании этой технологии возможно вычислять лексически сходные тексты, принадлежащие перу одного автора или написанные по единому плану, содержащие сходные семантические конструкции, и, таким образом, выявлять факт и структуру информационных “вбросов”.
Система “Талисман”, в свою очередь, позволяет отследить и выявить фиктивные аккаунты, служащие для распространения недостоверной информации, спама, имитации массовой активности – ботов. Анализ производится по полным и неполным данным, указанным в профилях социальных сетей, социальным связям аккаунтов, подпискам, спискам друзей и читателей. В результате анализа определяются такие демографические атрибуты, как возраст пользователя, а также семейное положение, уровень образования и так далее. Если значения тех или иных атрибутов не вписываются в создаваемый программным комплексом алгоритм, можно с серьезной долей уверенности говорить о том, что выпадающий из схемы профиль социальной сети принадлежит не живому человеку, а создан искусственно. Дальше приходит на помощь “Текстерра”, позволяющая вычислить множества ботов, созданных одной рукой либо ведущихся по одному лекалу-методичке.
Также технология “Талисман” позволяет на основании анализа неполных данных с использованием информации из социальных сетей вычислить примерное место проживания пользователя, его принадлежность к определенному социальному слою, приверженность той или иной идеологии и другую полезную информацию.
“Анализ такого постоянно меняющегося массива данных, как информация в соцсетях, сегодня – насущная необходимость, – отмечает директор ИСП РАН Арутюн Аветисян. – Это и маркетинговый инструмент, позволяющий оценивать аудиторию, выстраивать закономерности, помогающие работать адресно с разными возрастными и социальными группами. И во многом – инструмент безопасности. В последние десятилетия неограниченная интернет-анонимность стала источником угрозы для отдельных людей или компаний, для целых народов и стран. Работа в этом направлении способна в корне изменить ситуацию”.
Важным, по мнению директора ИСП РАН, является также этический аспект применения разработок института, сохранение тайны личных данных и неприкосновенности частной жизни.
“При применении подобных технологий необходимо, чтобы не нарушались права пользователей социальных сетей, не разглашались персональные данные”, – уточнил Денис Турдаков, заведующий отделом Информационных систем ИСП РАН. – Мы проводим научные исследования, дорабатываем “Текстерру” и “Талисман”. Всеобъемлющий анализ соцсетей пока затруднен, прорыв еще предстоит, но ждать его осталось недолго”.
В настоящий момент совершенствование этих программных комплексов продолжается, наращивается их функционал и мощность. В недалеком будущем внедрение разработок такого рода может серьезно изменить лицо глобальной информационной сети и культуру Интернет-общения.
Справка
Институт системного программирования Российской академии наук (ИСП РАН) – научно-исследовательская организация, специализирующаяся в области системного программирования. Институт разрабатывает технологии мирового уровня в таких областях, как операционные системы, компиляторные технологии, параллельные и распределенные вычисления, технологии верификации и тестирования программного обеспечения, анализ и обработка больших объемов данных, семантический поиск и др. Среди долговременных отечественных партнеров Института – ГосНИИАС, Вымпелком, Квант, Орион, среди зарубежных – Samsung, Huawei, DellEMC, HPE, Intel, Nvidia, RogueWave, LinuxFoundation. Со многими из них созданы совместные лаборатории.
Одна из главных задач ИСП РАН – подготовка кадров высшей квалификации в сфере ИТ. На базе Института функционируют собственная аспирантура и кафедры в МГУ, МФТИ и ВШЭ. Также ИСП РАН реализует совместные проекты с ведущими университетскими и исследовательскими центрами: Кембридж (Великобритания), Карнеги-Меллон (США), INRIA (Франция), Университет Пассау (Германия) и др.
ИСП РАН анализ данных арутюн авестисян денис турдаков интеллектуальный анализ текста интернет технология «талисман» технология «текстерра»
Информация предоставлена Информационным агентством «Научная Россия». Свидетельство о регистрации СМИ: ИА № ФС77-62580, выдано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций 31 июля 2015 года.
Источник: scientificrussia.ru