На сегодняшний день отсутствуют актуальные, математически точные системы поиска схожих аудиофайлов, работающие с русской музыкой. Существующие системы рекомендаций, основанные на жанровом сходстве и субъективных оценках слушателей, ограничены в возможностях.
Данная система представляет собой комплекс алгоритмов для извлечения характеристик аудиофайла и их последующей кластеризации. В качестве признаков используются мел-частотные кепстральные коэффициенты, статистика во временной области, статистика в частотной области, тональность. Для кластеризации используется алгоритм k-средних, а для последующей классификации - модернизированный метод k ближайших соседей.