cw 2 programowanie procesu id 1 Nieznany

background image

1

Autor: mgr inż. Jakub Siwiec

mgr inż. Jakub Siwiec (j.siwiec@utp.edu.pl)
mgr inż. Cezary Graul (cezary.graul@utp.edu.pl)
Katedra Informatyki w Zarządzaniu
Wydział Zarządzania

PODSTAWY ZARZĄDZANIA WIEDZĄ

Ćwiczenia praktyczne nr 2 – Programowanie pierwszego procesu text-mining’owego

Zadanie:

Na podstawie zdobytej na poprzednich zajęciach bazy tekstów anglojęzycznych (30 artykułów, w 30
plikach tekstowych *.txt, w języku angielskim, o minimalnej długości 1800 znaków bez spacji) oraz
zastosowaniu programu RapidMiner, zaprogramuj sw

ój pierwszy proces text-mining’owy.

Środowisko pracy:

stwórz „nowy folder” na pulpicie o nazwie Imie_nazwisko,

przekopiuj 1 plik tekstowy

(z poprzednich zajęć) do nowoutworzonego folderu,

otwórz program RapidMiner (Start  Programy  RapidMiner) w razie potrzeby ściągnij i
zainstaluj (Strona WZ

– materiały dla studenta).

Pierwsza i druga kostka:

stwórz „new process” i zapisz go jako swoje imię_i_nazwisko, bez polskich znaków,

skorzystaj z lewego drzewka procesów – rozwiń „Text Processing”,

przeciągnij proces „Read Document” na pulpit ekranu projektowego,

o

klikając na każdej kostce jednokrotnie masz możliwość sformułować założeń,

o w opcji file

wskaż skopiowany wcześniej plik tekstowy,

o use file extesion as type

– zaznaczone,

dołącz proces tokenizacji, połącz go z poprzednim oraz doprowadź do punktu wynikowego

uruchom procesy ikonką „play” i zapoznaj się z rezultatami,

następnie wróć do okna projektowego (ikona )

dodaj kolejny proces

„Filter Tokens (by length)

o

ustaw następujące założenia: min chars (min. il. Znaków) = 3) max chars= 25

uruchom ponownie procesy i sprawdź wyniki,

background image

2

Autor: mgr inż. Jakub Siwiec


Krok końcowy:

z otrzymanych wyników można wykonać zrzuty ekranu, które następnie zostaną wklejone do
dokumentu np. WORD, w celu ich zachowania i zaobserwowania zmian,

pozostawić swój plik projektowy w programie RapidMiner

usunąć dane z pulpitu,

opróżnić kosz,

wyłączyć komputer.


Wyszukiwarka

Podobne podstrony:
CW 8 Wzmacniacz operacyjny id 1 Nieznany
Podstawy programowania 1 W2 id Nieznany
Cw 7 Tranzystor unipolarny id 1 Nieznany
kolos automatyka cw PAiTS 03 id Nieznany
narodowy program zdrowia 2 id 3 Nieznany
cw 4 programowanie procesu klasteryzacji
Program socjoterapeutyczny id 3 Nieznany
Fundamentowanie cw cz 8 cd id Nieznany
programowanie niskopoziomowe id Nieznany
CW przykladowe zaliczenie id 9 Nieznany
Cw 2 Interpretacja modeli 2 id Nieznany
Hurra I Lekcja 4 cw Str 14 id 2 Nieznany
Cw 7 Tranzystor unipolarny 2 id Nieznany
MOO programowanie kwadratowe id Nieznany
Hurra I Lekcja 3 cw Str 12 id 2 Nieznany
podstawy programowania java id Nieznany
cw 3 programowanie procesow
CW 8 Wzmacniacz operacyjny 2 id Nieznany
3 4 5 14 cw cement unlocked id Nieznany (2)

więcej podobnych podstron