У Илона Маска неправильный подход к подсчету фейков и спама в Twitter: эксперты

Илон Маск только что купил Twitter.  Что теперь?

Генеральный директор Tesla Илон Маск в пятницу обрушил акции Twitter, когда сказал, что собирается «приостановить» приобретение социальной сети за 44 миллиарда долларов, пока он исследует долю поддельных и спам-аккаунтов на платформе.

Хотя позже Маск пояснил, что по-прежнему привержен сделке, он продолжал настаивать на проблеме фальшивых аккаунтов. Он написал в Твиттере, что его команда проведет собственный анализ, и выразил сомнение в точности цифр, которые Твиттер сообщил в своих последних финансовых отчетах.

В своем отчете о доходах за первый квартал этого года Twitter признал, что на его платформе существует ряд «ложных или спам-аккаунтов», наряду с законным монетизируемым ежедневным активным использованием или пользователями (mDAU). Компания сообщила: «Мы провели внутреннюю проверку выборки учетных записей и подсчитали, что среднее количество ложных или спам-аккаунтов в первом квартале 2022 года составляет менее 5% наших mDAU в течение квартала».

Twitter также признался в завышении количества пользователей на 1,4–1,9 млн пользователей за последние 3 года. Компания написала: «В марте 2019 года мы запустили функцию, которая позволяла людям связывать несколько отдельных учетных записей вместе, чтобы удобно переключаться между учетными записями», — сообщил Twitter. «В то время была допущена ошибка, так что действия, предпринятые через основную учетную запись, привели к тому, что все связанные учетные записи учитывались как mDAU».

Хотя Маск может быть оправданно любопытным, эксперты по социальным сетям, дезинформации и статистическому анализу говорят, что предложенный им подход к дальнейшему анализу крайне несовершенен.

Вот что генеральный директор SpaceX и Tesla сказал, что он сделает, чтобы определить, сколько спама, поддельных и дублирующих аккаунтов существует в Twitter:

«Чтобы выяснить это, моя команда проведет случайную выборку из 100 подписчиков @twitter. Я предлагаю другим повторить тот же процесс и посмотреть, что они обнаружат». Он разъяснил свою методологию в последующих твитах, добавив: «Выберите любой аккаунт с большим количеством подписчиков» и «Игнорируйте первые 1000 подписчиков, затем выберите каждого десятого. Я открыт для лучших идей».

Маск также сказал, не предоставив доказательств, что он выбрал 100 в качестве числа размера выборки для своего исследования, потому что это число, которое Twitter использует для расчета чисел в своих отчетах о доходах.

«Любой разумный процесс случайной выборки хорош. Если многие люди независимо получат одинаковые результаты для % поддельных/спамовых/дубликатов учетных записей, это будет показательно. Я выбрал 100 в качестве числа размера выборки, потому что это то, что Twitter использует для расчета <5 % подделка/спам/дубликат."

Twitter отказался комментировать, когда его спросили, было ли его описание его методологии точным.

Соучредитель Facebook Дастин Московиц высказался по этому поводу через свой собственный аккаунт в Twitter, отметив, что подход Маска на самом деле не является случайным, он использует слишком маленькую выборку и оставляет место для серьезных ошибок.

Он написал: «Кроме того, я чувствую, что« не доверяет команде Твиттера помочь взять образец »- это своего рода красный флаг».

Основатель и генеральный директор BotSentinel Кристофер Боузи сказал в интервью CNBC, что анализ, проведенный его компанией, показывает, что от 10% до 15% учетных записей в Twitter, вероятно, являются «неподлинными», включая подделки, спамеров, мошенников, гнусных ботов, дубликаты и «одиночные аккаунты». учетные записи с целью ненависти», которые обычно нацелены на отдельных лиц и преследуют их, а также другие лица, которые намеренно распространяют дезинформацию.

BotSentinel, который в основном поддерживается за счет краудфандинга, самостоятельно анализирует и выявляет недостоверную активность в Твиттере, используя сочетание программного обеспечения для машинного обучения и групп рецензентов. Сегодня компания отслеживает более 2,5 миллионов учетных записей Twitter, в основном англоязычных пользователей.

«Я думаю, что Twitter не реально классифицирует «ложные» и спам-аккаунты», — сказал Бузи.

Он также предупреждает, что количество фальшивых учетных записей может увеличиваться или уменьшаться в разных уголках Twitter в зависимости от обсуждаемых тем. Например, BotSentinel обнаружил, что больше недостоверных аккаунтов пишут о политике, криптовалюте, изменении климата и коронавирусе, чем те, которые обсуждают не вызывающие споров темы, такие как котята и оригами.

«Я просто не могу понять, что Маск делает что-то еще, кроме как троллит нас с этой глупой схемой выборки».

Карл Т. Бергстром

Автор книги «Вызов быков—«

Карл Т. Бергстром, профессор Вашингтонского университета, написавший в соавторстве книгу, призванную помочь людям понять данные и не попасться на удочку ложных заявлений в Интернете, сказал CNBC, что выборка ста подписчиков любой отдельной учетной записи Twitter не должна служить «должной осмотрительностью». «за приобретение компании за 44 миллиарда долларов.

Он сказал, что размер выборки в 100 человек на несколько порядков меньше нормы для исследователей социальных сетей, изучающих подобные вещи. Самая большая проблема, с которой Маск столкнется при таком подходе, известна как систематическая ошибка отбора.

Бергстром написал в сообщении CNBC: «Нет никаких оснований полагать, что подписчики официальной учетной записи Twitter являются репрезентативной выборкой учетных записей на платформе. Возможно, боты с меньшей вероятностью подпишутся на эту учетную запись, чтобы избежать обнаружения. следовать, чтобы казаться законным. Кто знает? Но я просто не могу понять, что Маск делает что-то еще, кроме как троллит нас с этой глупой схемой выборки».

Ваш адрес email не будет опубликован.