EmoSymphony - muzyka, która czuje to, co Ty¶

Aplikacja, która patrzy na Twoje oblicze i komponuje dla Ciebie muzykę w czasie rzeczywistym.

Czym jest EmoSymphony?¶

Wyobraź sobie, że siadasz przed komputerem, a on - zamiast pytać, czego chcesz posłuchać - po prostu patrzy na Ciebie i wie. Widzi radość w Twoich oczach, zmęczenie po ciężkim dniu, skupienie podczas pracy. I odpowiada muzyką.

Właśnie tym jest EmoSymphony: aplikacją, która w czasie rzeczywistym rozpoznaje Twoją emocję poprzez kamerę internetową, a następnie dobiera i odtwarza muzykę idealnie dopasowaną do Twojego nastroju - i do Twojego wieku.

Nie musisz niczego klikać. Nie musisz niczego wybierać. Muzyka pojawia się sama.

Jak to działa?¶

Kamera patrzy na Ciebie - aplikacja co chwilę „zagląda" w Twój wyraz twarzy przez kamerę.
Sztuczna inteligencja rozpoznaje emocję - system analizuje mimikę i określa, czy jesteś szczęśliwy, smutny, zły, zaskoczony, czy może po prostu spokojny.
Dobierana jest muzyka - na podstawie emocji i szacowanego wieku dobierany jest odpowiedni utwór z wcześniej wygenerowanej biblioteki.
Muzyka płynnie się zmienia - co 15 sekund (nawet jeśli emocja się nie zmieniła) pojawia się nowy utwór z płynnym przejściem, by nie było nudy.

Wszystko dzieje się lokalnie na Twoim komputerze - żadne zdjęcia ani dane o Twojej twarzy nie są nigdzie wysyłane.

Co wyróżnia EmoSymphony?¶

Reaguje na emocje - rozpoznaje radość, smutek, złość, zaskoczenie i neutralny spokój.
Dopasowuje muzykę do wieku - muzyka dla 15-latka brzmi inaczej niż dla 40-latka.
Generuje muzykę AI - biblioteka ścieżek jest tworzona przez model AI (MusicGen od Meta), więc każdy utwór jest unikalny.
Działa offline - po pierwszym uruchomieniu nie potrzebuje internetu; Twoja prywatność jest chroniona.
Podgląd na żywo - w oknie aplikacji widzisz obraz z kamery z nakładkami pokazującymi wykrytą emocję i szacowany wiek.
Płynne przejścia - zmiana ścieżki następuje z 500 ms crossfade, bez żadnych zgrzytów.

Kod źródłowy i pobieranie¶

Projekt jest open-source. Zapraszamy do zapoznania się z kodem, zgłaszania pomysłów i współtworzenia!

Repozytorium GitHub: github.com/blackbat13/EmoSymphony

Minimalne wymagania sprzętowe¶

Aby uruchomić EmoSymphony, Twój komputer powinien spełniać poniższe wymagania:

Komponent	Minimum
System operacyjny	Windows 10 / Ubuntu 20.04 / macOS 11+
Procesor (CPU)	4-rdzeniowy, 2.5 GHz (Intel Core i5 / AMD Ryzen 5 lub nowszy)
Pamięć RAM	8 GB
Karta graficzna (GPU)	Opcjonalna, ale zalecana (CUDA) - bez GPU generowanie muzyki trwa dłużej
Miejsce na dysku	~5 GB (modele AI ważą ok. 3–4 GB i są pobierane przy pierwszym uruchomieniu)
Kamera internetowa	Dowolna kamera (wbudowana lub zewnętrzna USB)
Python	3.10 lub nowszy
Internet	Potrzebny tylko przy pierwszym uruchomieniu (pobieranie modeli AI)

Uwaga: Pierwsze uruchomienie może trwać od kilku do kilkunastu minut - aplikacja pobiera modele AI (~3–4 GB). Kolejne starty są natychmiastowe, bo modele są zapisane lokalnie.

Technologie użyte w projekcie¶

Python - główny język aplikacji
DeepFace - rozpoznawanie emocji i szacowanie wieku z obrazu twarzy
MusicGen (Meta AI) - generatywny model AI do tworzenia muzyki
OpenCV - przechwytywanie obrazu z kamery i detekcja twarzy
Pygame - odtwarzanie dźwieku z płynnymi przejściami

Chcesz spróbować?¶

Szczegółowa instrukcja instalacji i uruchomienia dostępna jest w repozytorium GitHub. Projekt działa na Windows, Linux i macOS.

Przejdź do repozytorium →

EmoSymphony - bo muzyka powinna rozumieć Cię, nie odwrotnie.