Analiza danych tekstowych i języka naturalnego w Pythonie
➡️ Czego się nauczysz?
W trakcie warsztatu nabędziesz następujące umiejętności:
– Poznasz metody przetwarzania tekstu, w tym techniki uczenia maszynowego wykorzystywane w klasyfikacji danych tekstowych,
– Dowiesz się czym są embeddingi,
– Nauczysz się, jak przygotować tekst do analizy.
➡️ Dla kogo:
Warsztat jest skierowany do programistów Pythona, którzy są zainteresowani uczeniem maszynowym oraz analizą tekstu, ale mają w tym obszarze niewielką lub żadną wiedzę.
➡️ Wymagania wstępne
Na tym warsztacie prosimy o:
– Umiejętność programowania w Pythonie,
– Python w wersji minimum 3.11 (najlepiej Anaconda),
– Jupyter Notebook / Jupyter Lab,
– Biblioteki: nltk, spacy, pandas, gensim.
➡️ Program:
1. Podstawowe pojęcia w NLP,
2. Przetwarzanie danych tekstowych (m.in. tokenizacja, lematyzacja itp.),
3. Wizualizacja danych tekstowych,
4. Wektoryzacja i embeddingi,
5. Uczenie maszynowe w analizie tekstu.
➡️ Informacje o prowadzącym:
Patryk Palej
Od 2018 pracuje w obszarach analizy danych, uczenia maszynowego oraz programowania w Pythonie. Posiada background akademicki związany z matematycznym modelowaniem procesów fizycznych. Lubi dzielić się zdobytą wiedzą, a w wolnym czasie jeździ po świecie motocyklem. Obecnie trener bootcampu Data Science PRO od Kodołamacza – datasciencepro.kodolamacz.pl.
➡️ Uwagi nt. uzyskania certyfikatu
W cenie swojego zakupu możesz otrzymać certyfikat, potwierdzający znajomość materiału merytorycznego, do którego dostęp wykupiłeś/aś. Warunkiem uzyskania takiego dokumentu jest uzyskanie pozytywnego wyniku z quizu podsumowującego. Szczegóły dot. tego tematu znajdują się w panelu nagrania.