ИИ научился предсказывать уровень безработицы в США по соцсетям
Данная модель анализирует сообщения в Twitter (X) о потере работы, используя подход, который отличается от традиционных методов поиска. Вместо фиксированных фраз нейросеть распознает разговорные выражения и сленг, а также учитывает опечатки, что позволяет выявить в 13 раз больше людей, потерявших работу, с высокой степенью точности.
Чтобы компенсировать недостатки выборки, исследователи использовали фотографии профилей для определения возраста, пола и местоположения пользователей, а затем корректировали данные в соответствии с результатами переписи населения США.
Модель протестировали на данных, собранных в период с 2020 по 2022 годы, включая кризисный период пандемии коронавируса. Например, в марте 2020 года число заявок на пособие по безработице возросло с 252 тысяч до 2,9 миллиона, в то время как традиционные прогнозы составили всего 327 тысяч. JoblessBERT смогла предсказать 2,66 миллиона заявок всего за два дня до окончания отчетного периода.
В среднем, в двухнедельном прогнозе точность JoblessBERT превышала традиционные методы на 54% на уровне всей страны и на 36% в отдельных штатах. Эта система также может быть использована для анализа данных на уровне городов, заполняя пробелы в статистике, когда данные публикуются нерегулярно.
Однако авторы подчеркивают ограничения своего подхода: исследование опиралось только на англоязычные данные, а начиная с 2023 года доступ к данным Twitter значительно сократился. Тем не менее, они считают, что метод может быть адаптирован для использования на других платформах и языках, что особенно актуально для развивающихся стран, где сбор данных о рынке труда является затруднительным.
Читайте также:
