3784495782

3784495782



Redukcja wymiaru danych

•    Trudności w przetwarzaniu, indeksowaniu

i przeszukiwaniu wielu dokumentów opisanych ^ bardzo dużą liczbą termów

•    Potrzeba redukcji wymiaru danych tekstowych:

•    Latem Scmatic Indexing

Podobne dokumenty mają podobne częstości słów.

Macierz częstości dokumentów i termów należy transformować

macierzy A.S.B, gdzie A i B mają ortogonalne kolumny a Sjest macierzą diagonalną:

Uw zględnia się tylko £e| 100.300] największy ch wartości S,

•    Stosowane także inne algorytmy, np. grupowania lub SOM

Dekompozycja SVD • pomijając szczegóły matematyczne...

kolumny macierzy U tworzą ortogonalną bazę w i przestrzeni kolumn macieizy A

wektory te wykazują podobieństwo do „tematów" ■ obecnych w A


Przykład — Lingo



Wyszukiwarka

Podobne podstrony:
Algorytm redukcji wymiaru i liczności próby dla celów procedur eksploracyjnej analizy dany
IMG?14 (2) kwantyzacji q. można obliczyć z danych znamionowych przetwornika wg (3.11) Prawdziwą jedn
Spis treści Braki danych 189 Walidacja indeksu 192 Status kobiety - przykład procesu
15 Redukcje wielomianowe i NP-trudność Zadanie 139. Pokaż, że 5SAT<P3SAT. Zadanie 140. (za 2 punk
IMAG0582 (4) [^Algorytmy przetwarzania danych•    Cyfrowe przetwarzanie danych e
IMAG0583 (2) Algorytmy przetwarzania danych •    Cyfrowe przetwarzanie danych em
IMAG0585 (4) Algorytmy przetwarzania danych•    Cyfrowe przetwarzanie danych emp
-    punkty wprowadzania danych:    sposób przetwarzania informac
DSC00022 (15) Klasyczne problemy z redukcją wymiarów (tranzystor MOS) Redukcja giuboio dielektryka.
10.7.    Obowiązki administratora danych związane z przetwarzaniem danych osobowych 1
44 Konrad Eckes poddane wstępnym uproszczeniom i redukcji wymiarów muszą być uformowane do postaci
13 listopad 2015Polityka bezpieczeństwa informacji w tym danych osobowych Po odbytym przeszkoleniu p
57119 ullman185 (2) .3 / U 3. Jł-ZYK BAZ DANYCH J>DL ♦    Indeksy (indexes): Nie s
18280 K (3) KolokwiumGdańsk 2010-06-09 danych - Nazwisko «r- indeksZestaw K I i [lOpktJ Co to jest b
Zdj?cie0262 54 Podstawowe zagadnienia baz danych i procesów przetwarzań m danych w pozostałych dwóch

więcej podobnych podstron