Как Slopless обнаруживает ИИ-музыку
Slopless использует два источника данных для обнаружения ИИ-музыки на Яндекс Музыке.
Источники данных
Deezer
Deezer — единственный стриминговый сервис с маркировкой ИИ-музыки. Slopless сопоставляет релизы артистов на Яндекс Музыке с Deezer и таким образом выявляет артистов, использующих ИИ для генерации музыки.
Модель Slopless
Не все артисты загружают своё творчество на Deezer. Поэтому Slopless использует собственную статистическую модель (XGBoost) для анализа исполнителей, которых нет в Deezer. Модель анализирует поведение артистов, паттерны релизов, связи с лейблами и другие доступные открытые данные.
Статистическая модель не обеспечивает абсолютную точность и иногда может ошибаться. Матрица ошибок (confusion matrix) последней версии модели следующая:
| Предсказано как не ИИ | Предсказано как ИИ | |
|---|---|---|
| Действительно не ИИ | 96 740 | 2784 |
| Действительно ИИ | 423 | 14 370 |
Иначе говоря, из всех, кого модель называет ИИ, 83.77% действительно оказываются ИИ, а из всех ИИ-артистов модель находит 97.14%.
Больше технических подробностей можно прочитать в этой статье.