Nowe uslugi 2 0 Przewodnik po analizie zbiorow danych noweus 2

Tytuł oryginału: Programming Collective Intelligence: Building Smart Web 2.0 Applications

Tłumaczenie: Piotr Pilch

ISBN: 978-83-246-9298-9

Authorized Polish translation of the English edition Programming Collective Intelligence
ISBN 9780596529321 © 2007 Toby Segaran.

This translation is published and sold by permission of O’Reilly Media, Inc.,
which owns or controls all rights to publish and sell the same.

All rights reserved. No part of this book may be reproduced or transmitted in any form or by any means,
electronic or mechanical, including photocopying, recording or by any information storage retrieval system,
without permission from the Publisher.

Wszelkie prawa zastrzeżone. Nieautoryzowane rozpowszechnianie całości lub fragmentu niniejszej
publikacji w jakiejkolwiek postaci jest zabronione. Wykonywanie kopii metodą kserograficzną,
fotograficzną, a także kopiowanie książki na nośniku filmowym, magnetycznym lub innym powoduje
naruszenie praw autorskich niniejszej publikacji.

Wszystkie znaki występujące w tekście są zastrzeżonymi znakami firmowymi bądź towarowymi ich
właścicieli.

Autor oraz Wydawnictwo HELION dołożyli wszelkich starań, by zawarte w tej książce informacje były
kompletne i rzetelne. Nie bierze jednak żadnej odpowiedzialności ani za ich wykorzystanie, ani za
związane z tym ewentualne naruszenie praw patentowych lub autorskich. Wydawnictwo HELION nie
ponosi również żadnej odpowiedzialności za ewentualne szkody wynikłe z wykorzystania informacji
zawartych w książce.

Wydawnictwo HELION
ul. Kościuszki 1c, 44-100 GLIWICE
tel. 32 231 22 19, 32 230 98 63
e-mail: helion@helion.pl
WWW: http://helion.pl (księgarnia internetowa, katalog książek)

Pliki z przykładami omawianymi w książce można znaleźć pod adresem:
ftp://ftp.helion.pl/przyklady/noweus.zip

Drogi Czytelniku!
Jeżeli chcesz ocenić tę książkę, zajrzyj pod adres
http://helion.pl/user/opinie/noweus
Możesz tam wpisać swoje uwagi, spostrzeżenia, recenzję.

Printed in Poland.

Księgarnia internetowa

•

Lubię to! » Nasza społeczność

Spis treļci

Sĥowo wstýpne .............................................................................................................11

Przedmowa .................................................................................................................. 13

1. Inteligencja zbiorowa — wprowadzenie ................................................................... 21

Czym jest inteligencja zbiorowa?

Czym jest uczenie maszynowe?

Ograniczenia uczenia maszynowego

Rzeczywiste przykäady

Inne zastosowania algorytmów uczñcych

2. Tworzenie rekomendacji ............................................................................................. 27

Filtrowanie grupowe

Gromadzenie preferencji

Znajdowanie podobnych uĔytkowników

Rekomendowanie pozycji

Dopasowywanie produktów

Tworzenie systemu rekomendowania odnoĈników del.icio.us

Filtrowanie oparte na pozycjach

Zastosowanie zbioru danych MovieLens

Filtrowanie oparte na uĔytkownikach czy pozycjach?

çwiczenia

3. Wykrywanie grup ........................................................................................................49

Porównanie uczenia nadzorowanego z nienadzorowanym

Wektory wyrazów

Grupowanie hierarchiczne

Rysowanie dendrogramu

Grupowanie kolumn

Grupowanie k-Ĉrednich

Kup książkę

Poleć książkę

_ Spis treļci

Klastry preferencji

WyĈwietlanie danych w dwóch wymiarach

Inne rzeczy, które mogñ byè grupowane

çwiczenia

4. Wyszukiwanie i klasyfikowanie ................................................................................. 73

Co znajduje siö w wyszukiwarce?

Prosty przeszukiwacz

Budowanie indeksu

Odpytywanie

Klasyfikacja oparta na treĈci

UĔycie odnoĈników zewnötrznych

Uczenie na podstawie klikniöè

çwiczenia

101

5. Optymalizacja ............................................................................................................ 103

PodróĔ grupy osób

104

Reprezentowanie rozwiñzaþ

105

Funkcja kosztu

106

Wyszukiwanie losowe

108

Metoda najwiökszego wzrostu

109

Symulowane wyĔarzanie

111

Algorytmy genetyczne

113

Wyszukiwania rzeczywistych lotów

117

Optymalizowanie pod kñtem preferencji

122

Wizualizacja sieci

125

Inne moĔliwoĈci

130

çwiczenia

130

6. Filtrowanie dokumentów .......................................................................................... 133

Filtrowanie spamu

133

Dokumenty i wyrazy

134

Trenowanie klasyfikatora

135

Obliczanie prawdopodobieþstw

137

Naiwny klasyfikator

139

Metoda Fishera

142

Utrwalanie klasyfikatorów po przeprowadzonym treningu

146

Filtrowanie kanaäów informacyjnych blogów

148

Poprawianie wykrywania wäaĈciwoĈci

150

UĔycie interfejsu Akismet

152

Alternatywne metody

153

çwiczenia

154

Kup książkę

Poleć książkę

Spis treļci _

7. Modelowanie przy użyciu drzew decyzyjnych .........................................................157

Przewidywanie rejestracji

157

Wprowadzenie do drzew decyzyjnych

159

Uczenie drzewa

160

Wybór najlepszego podziaäu

162

Budowanie drzewa rekurencyjnego

164

WyĈwietlanie drzewa

166

Klasyfikowanie nowych obserwacji

168

Przycinanie drzewa

169

Radzenie sobie z brakujñcymi danymi

171

Radzenie sobie z wynikami liczbowymi

172

Modelowanie cen domów

173

Modelowanie „atrakcyjnoĈci”

176

Kiedy stosowaè drzewa decyzyjne?

178

çwiczenia

179

8. Budowanie modelu cen ..............................................................................................181

Budowanie przykäadowego zbioru danych

181

Metoda k-najbliĔszych sñsiadów

183

Sñsiednie elementy z okreĈlonñ wagñ

186

Walidacja krzyĔowa

189

Zmienne heterogeniczne

191

Optymalizowanie skali

194

Rozkäady niejednolite

196

UĔycie rzeczywistych danych — interfejs API serwisu eBay

200

Kiedy uĔywaè metody k-najbliĔszych sñsiadów?

207

çwiczenia

207

9. Zaawansowane klasyfikowanie:

metody jédrowe i maszyny wektorów noļnych ......................................................209

Zbiór danych swatki

209

TrudnoĈci zwiñzane z danymi

211

Podstawowa klasyfikacja liniowa

213

WäaĈciwoĈci skategoryzowane

217

Skalowanie danych

218

Metody jñdrowe

220

Maszyny wektorów noĈnych

223

Zastosowanie biblioteki LIBSVM

225

Dopasowywanie w serwisie Facebook

227

çwiczenia

232

Kup książkę

Poleć książkę

_ Spis treļci

10. Znajdowanie niezależnych wĥaļciwoļci ..................................................................233

Zbiór artykuäów

234

WczeĈniejsze rozwiñzania

237

Nieujemna faktoryzacja macierzy

240

WyĈwietlanie wyników

246

UĔycie danych rynku gieädowego

249

çwiczenia

254

11. Inteligencja rozwojowa .............................................................................................255

Czym jest programowanie genetyczne?

255

Programy w postaci drzew

258

Tworzenie populacji poczñtkowej

261

Testowanie rozwiñzania

263

KrzyĔowanie

267

Budowanie Ĉrodowiska

269

Prosta gra

272

Dalsze moĔliwoĈci

276

çwiczenia

278

12. Algorytmy — podsumowanie ................................................................................... 281

Klasyfikator bayesowski

281

Klasyfikator drzew decyzyjnych

285

Sieci neuronowe

288

Maszyny wektorów noĈnych

292

Metoda k-najbliĔszych sñsiadów

296

Grupowanie

299

Skalowanie wielowymiarowe

303

Nieujemna faktoryzacja macierzy

305

Optymalizacja

307

A Zewnýtrzne biblioteki ................................................................................................311

Universal Feed Parser

311

Python Imaging Library

311

Beautiful Soup

312

pysqlite

313

NumPy

314

matplotlib

315

pydelicious

316

Kup książkę

Poleć książkę

Spis treļci _

B Formuĥy matematyczne ..............................................................................................317

OdlegäoĈè euklidesowa

317

Wspóäczynnik korelacji Pearsona

317

ćrednia waĔona

318

Wspóäczynnik Tanimoto

319

Prawdopodobieþstwo warunkowe

319

NiejednorodnoĈè Giniego

320

Entropia

321

Wariancja

321

Funkcja Gaussa

322

Iloczyny skalarne

322

Skorowidz ..................................................................................................................32

10 _ Spis treļci

ROZDZIAĤ 1.

Inteligencja zbiorowa — wprowadzenie

Netflix to internetowa wypoĔyczalnia päyt DVD, która umoĔliwia wybór filmów z wysyäkñ do

domu. Firma podaje rekomendacje na podstawie filmów, które zostaäy wczeĈniej wypoĔyczone
przez klientów. Pod koniec 2006 r. firma Netflix poinformowaäa o nagrodzie w wysokoĈci 1 mln
dolarów dla pierwszej osoby, która poprawi dokäadnoĈè systemu rekomendacji wypoĔyczalni
o 10%. Ponadto kaĔdego roku firma bödzie wröczaè dodatkowo 50 tys. dolarów aktualnemu lide-
rowi do czasu trwania konkursu. W konkursie wziöäy udziaä tysiñce zespoäów z caäego Ĉwiata.
W kwietniu 2007 r. najlepszemu zespoäowi udaäo siö uzyskaè poprawö rekomendacji o 7%. Ko-
rzystajñc z danych dotyczñcych filmów, które spodobaäy siö poszczególnym klientom, firma

Netflix ma moĔliwoĈè rekomendowania filmów innym klientom. Ci klienci mogli nawet nigdy
o nich nie säyszeè. Po ich obejrzeniu mogñ oni zdecydowaè siö na kolejne filmy. KaĔdy sposób
ulepszenia swojego systemu rekomendacji wart jest dla firmy Netflix mnóstwo pieniödzy.

Wyszukiwarka internetowa firmy Google zaczöäa dziaäaè w 1998 r. W tamtym czasie istniaäo juĔ
kilka duĔych wyszukiwarek. Wiele osób przyjöäo, Ĕe nowy gracz nie bödzie w stanie konkuro-
waè z gigantami branĔowymi. JednakĔe zaäoĔyciele firmy Google zastosowali zupeänie nowñ
metodö tworzenia rankingów wyników wyszukiwania, korzystajñc z odnoĈników na milionach

stron internetowych podczas okreĈlania, które strony sñ najodpowiedniejsze. Wyniki wyszuki-
wania wyszukiwarki Google okazaäy siö znacznie lepsze od oferowanych przez innych gra-
czy, którzy w 2004 r. obsäugiwali 85% wyszukiwaþ w Internecie. ZaäoĔyciele firmy Google
zaliczajñ siö obecnie do najbogatszych ludzi Ĉwiata.

Co te dwie firmy majñ ze sobñ wspólnego? Obie doszäy do nowych wniosków i stworzyäy nowe
moĔliwoĈci biznesowe, korzystajñc z zaawansowanych algorytmów w celu poäñczenia danych
zebranych od wielu róĔnych osób. MoĔliwoĈè gromadzenia informacji i moc obliczeniowa

pozwalajñca na ich interpretowanie stworzyäy ogromne moĔliwoĈci wspóäpracy oraz lepszego
zrozumienia uĔytkowników i klientów. Tego rodzaju dziaäania majñ miejsce w róĔnych przy-
padkach. Serwisom randkowym zaleĔy na szybszym znalezieniu najlepiej dopasowanych kan-
dydatów. Pojawiajñ siö firmy przewidujñce zmiany cen biletów lotniczych. Niemal kaĔdemu
zaleĔy na lepszym zrozumieniu swoich klientów, aby przygotowaè reklamy trafiajñce do
wäaĈciwszych osób.

To tylko kilka przykäadów ekscytujñcej dziedziny inteligencji zbiorowej. Rozpowszechnianie siö

nowych usäug powoduje, Ĕe kaĔdego dnia pojawiajñ siö nowe moĔliwoĈci. Wierzö, Ĕe opano-
wanie uczenia maszynowego i metod statystycznych stanie siö jeszcze waĔniejsze w przeróĔ-
nych dziedzinach, szczególnie w przypadku interpretowania i organizowania ogromnej iloĈci
informacji tworzonych przez ludzi na caäym Ĉwiecie.

Kup książkę

Poleć książkę

Rozdziaĥ 1. Inteligencja zbiorowa — wprowadzenie

Czym jest inteligencja zbiorowa?

Pojöcie inteligencji zbiorowej jest uĔywane od dziesiöcioleci. Jego znaczenie i popularnoĈè zaczöäy

siö zwiökszaè wraz z pojawieniem siö nowych technologii komunikacji. Choè nazwa terminu
moĔe przywodziè na myĈl pojöcia zwiñzane ze ĈwiadomoĈciñ zbiorowñ lub zjawiskiem nad-
przyrodzonym, to uĔywajñc go, specjaliĈci od technologii majñ zwykle na myĈli äñczenie za-
chowaþ, preferencji lub pomysäów grupy osób w celu uzyskania nowatorskich spostrzeĔeþ.

OczywiĈcie inteligencja zbiorowa byäa moĔliwa przed pojawieniem siö Internetu. Nie jest wy-
magana sieè WWW, aby zgromadziè dane od róĔnych grup ludzi, poäñczyè je i poddaè analizie.
Jednñ z najbardziej podstawowych form inteligencji zbiorowej jest ankieta lub spis ludnoĈci.

Zbieranie odpowiedzi od duĔej grupy ludzi umoĔliwia uzyskanie wniosków statystycznych
dotyczñcych grupy, których nie okreĈliäby w pojedynkö Ĕaden jej czäonek. Tworzenie nowych
wniosków przy udziale niezaleĔnych uczestników w rzeczywistoĈci jest tym, do czego säuĔy
inteligencja zbiorowa.

Jej dobrze znanym przykäadem sñ rynki finansowe, w przypadku których cena nie jest ustalana
przez jednñ osobö ani nie jest wynikiem skoordynowanego dziaäania, lecz stanowi efekt opera-
cji handlowych wielu niezaleĔnych od siebie osób, które dziaäajñ zgodnie z tym, co w ich prze-

konaniu säuĔy ich najlepszemu interesowi. Choè z poczñtku moĔe siö to wydawaè sprzeczne
z intuicjñ, rynki kontraktów terminowych, gdzie wielu uczestników handluje kontraktami, próbujñc
okreĈliè ich przyszäe ceny, sñ uwaĔane za lepsze w przewidywaniu cen niĔ eksperci, którzy
niezaleĔnie przygotowujñ prognozy. Wynika to stñd, Ĕe w przypadku tworzenia przewidywaþ
takie rynki äñczñ w sobie wiedzö, doĈwiadczenie i spostrzeĔenia tysiöcy osób, a nie analizujñ
jedynie punkt widzenia jednej osoby.

ChociaĔ metody inteligencji zbiorowej istniaäy przed powstaniem Internetu, moĔliwoĈè gro-

madzenia informacji od tysiöcy, a nawet milionów osób w sieci internetowej stworzyäa wiele
nowych opcji analizy. Ludzie uĔywajñ Internetu do robienia zakupów, prowadzenia badaþ,
szukania rozrywki i budowania wäasnych witryn internetowych. Wszystkie te dziaäania mo-
gñ byè monitorowane i wykorzystywane do uzyskiwania informacji bez Ĕadnej koniecznoĈci
wpäywania na intencje uĔytkownika przez zadawanie mu pytaþ. Istnieje ogromna liczba
moĔliwych metod przetwarzania i interpretowania tych informacji. Oto dwa kluczowe przy-
käady prezentujñce przeciwstawne metody.

Wikipedia

to internetowa encyklopedia stworzona w caäoĈci w wyniku wspóäpracy uĔyt-

kowników. Dowolna strona moĔe zostaè utworzona lub zmodyfikowana przez kaĔdego.
Niewielka liczba administratorów monitoruje powtarzajñce siö naduĔycia. Serwis Wikipe-
dia ma wiöcej wpisów niĔ jakakolwiek inna encyklopedia. Pomimo manipulacji dokony-
wanych przez uĔytkowników o zäych intencjach, generalnie moĔe byè uwaĔana za dokäad-

nñ w przypadku wiökszoĈci zagadnieþ. Jest to przykäad inteligencji zbiorowej, poniewaĔ
kaĔdy artykuä jest utrzymywany przez duĔñ grupö osób. Efektem jest encyklopedia znacznie
wiöksza od jakiejkolwiek, która mogäaby zostaè stworzona przez dowolnñ pojedynczñ,
skoordynowanñ grupö. Oprogramowanie encyklopedii Wikipedia nie realizuje Ĕadnych
wyszukanych operacji w odniesieniu do uczestniczñcych uĔytkowników. Po prostu Ĉle-
dzi zmiany i wyĈwietla najnowszñ wersjö.

Wspomniana wczeĈniej wyszukiwarka Google to najpopularniejsza na Ĉwiecie wyszukiwar-
ka internetowa. Jako pierwsza zaczöäa oceniaè strony internetowe na podstawie liczby
innych stron, które siö do nich odwoäujñ. W przypadku tej metody oceniania uzyskiwane

Kup książkę

Poleć książkę

Czym jest uczenie maszynowe?

sñ informacje o tym, co tysiñce osób stwierdziäy na temat konkretnej strony internetowej.
Informacje te säuĔñ do tworzenia rankingu wyników wyszukiwania. Jest to rzykäad inteli-
gencji zbiorowej bardzo odmienny od Wikipedii. Serwis Wikipedia wprost zaprasza swoich
uĔytkowników do uczestnictwa, natomiast wyszukiwarka Google wydobywa waĔne infor-

macje o tym, jakie dziaäania twórcy treĈci sieciowych podejmujñ w obröbie wäasnych wi-
tryn, a nastöpnie wykorzystuje je do generowania wyników dla swoich uĔytkowników.

Choè Wikipedia stanowi znakomity zasób i wyjñtkowy przykäad inteligencji zbiorowej, swoje
istnienie zawdziöcza bardziej bazie uĔytkowników dodajñcych informacje niĔ sprytnym algo-
rytmom zawartym w oprogramowaniu. W ksiñĔce skoncentrowano siö na drugim koþcu tego
spektrum, czyli na omówieniu algorytmów takich jak PageRank wyszukiwarki Google, który
pobiera dane uĔytkownika i przeprowadza obliczenia w celu utworzenia nowych informacji

mogñcych wpäynñè na poprawö komfortu obsäugi uĔytkownika. CzöĈè danych jest gromadzona
jawnie, byè moĔe przez proĈbö o ocenö róĔnych rzeczy skierowanñ do internautów, a czöĈè
jest zbierana mimochodem przez obserwacjö tego, co jest przez nich kupowane. W obu przypad-
kach istotne jest nie samo zbieranie i wyĈwietlanie informacji, lecz przetwarzanie ich w inteli-
gentny sposób i generowanie nowych wiadomoĈci.

W ksiñĔce zostanñ zaprezentowane metody gromadzenia danych za poĈrednictwem otwartych
interfejsów API. Przedstawione bödñ róĔne algorytmy uczenia maszynowego oraz metody

statystyczne. Taka kombinacja umoĔliwi przygotowanie metod inteligencji zbiorowej dla danych
uzyskanych we wäasnych aplikacjach, a takĔe gromadzenie danych z innych miejsc i ekspery-
mentowanie z ich wykorzystaniem.

Czym jest uczenie maszynowe?

Uczenie maszynowe to dziedzina podlegajñca sztucznej inteligencji zwiñzanej z algorytmami,
które umoĔliwiajñ uczenie komputerów. W wiökszoĈci przypadków oznacza to, Ĕe algorytm
otrzymuje zbiór danych i okreĈla wnioski dotyczñce ich wäaĈciwoĈci. Informacje te umoĔliwiajñ
tworzenie przewidywaþ odnoĈnie do innych danych, które mogñ pojawiè siö w przyszäoĈci.
Jest to moĔliwe, poniewaĔ niemal wszystkie nielosowe dane zawierajñ wzorce, które pozwalajñ
maszynie dokonywaè uogólnieþ. W tym celu trenowany jest model przy uĔyciu tego, co maszyna

uzna za najwaĔniejsze aspekty danych.

Aby zrozumieè, jak powstajñ modele, rozwaĔmy prosty przykäad ze skomplikowanej dzie-
dziny, jakñ jest filtrowanie poczty elektronicznej. ZaäóĔmy, Ĕe otrzymywana jest spora iloĈè
spamu, który zawiera säowa „apteka internetowa”. Czäowiek ma odpowiednie moĔliwoĈci
rozpoznawania wzorców, dlatego potrafi szybko stwierdziè, Ĕe kaĔda wiadomoĈè zawierajñca
te dwa säowa to spam, który powinien trafiè bezpoĈrednio do kosza. Jest to uogólnienie. W rze-
czywistoĈci zostaä utworzony myĈlowy model tego, czym jest spam. Po zgäoszeniu kilku takich

wiadomoĈci jako spamu algorytm uczenia maszynowego zaprojektowany do filtrowania spa-
mu powinien byè w stanie dokonaè takiego samego uogólnienia.

Istnieje wiele róĔnych algorytmów uczenia maszynowego, cechujñcych siö róĔnñ siäñ dziaäania
i dopasowanych do róĔnego typu problemów. Niektóre z nich, takie jak drzewa decyzyjne, sñ
transparentne. Oznacza to, Ĕe obserwator moĔe w peäni pojñè proces rozumowania realizowa-
ny przez maszynö. Inne algorytmy, takie jak sieci neuronowe, to „czarna skrzynka”. Oznacza to,
Ĕe generujñ one odpowiedĒ, czösto jednak bardzo trudne jest odtworzenie zwiñzanego z tym

rozumowania.

Kup książkę

Poleć książkę

Rozdziaĥ 1. Inteligencja zbiorowa — wprowadzenie

Wiele algorytmów uczenia maszynowego intensywnie korzysta z matematyki i statystyki.
Zgodnie z definicjñ, którñ wczeĈniej podaäem, moĔna nawet stwierdziè, Ĕe prosta analiza kore-
lacji i regresja to podstawowe formy uczenia maszynowego. W ksiñĔce nie zaäoĔono, Ĕe czy-
telnik ma wiedzö z dziedziny statystyki, dlatego podjñäem siö próby objaĈnienia zastosowanej

statystyki w jak najprostszy sposób.

Ograniczenia uczenia maszynowego

Uczenie maszynowe nie jest pozbawione wad. Algorytmy majñ róĔne moĔliwoĈci uogólniania

duĔych zbiorów wzorców. Wzorzec, który nie przypomina Ĕadnego wczeĈniej napotkanego
przez algorytm, z duĔym prawdopodobieþstwem zostanie niewäaĈciwie zinterpretowany. Ludzie
mogñ wykorzystywaè rozlegäe doĈwiadczenie i wiedzö o charakterze kulturowym, a takĔe
majñ niezwykäñ zdolnoĈè rozpoznawania podobnych sytuacji podczas podejmowania decyzji
dotyczñcych nowych wiadomoĈci. Z kolei metody uczenia maszynowego mogñ jedynie
uogólniaè na podstawie juĔ napotkanych danych, i to w bardzo ograniczony sposób.

Metoda filtrowania spamu, która zostanie przedstawiona w ksiñĔce, opiera siö na wystöpowaniu

säów lub fraz bez wzglödu na ich znaczenie lub na strukturö zdaþ. Choè teoretycznie moĔliwe
jest zbudowanie algorytmu, który uwzglödniaäby gramatykö, w praktyce dzieje siö to rzadko
z powodu wymaganych nakäadów nieproporcjonalnie duĔych w stosunku do uzyskiwanego
ulepszenia algorytmu. Zrozumienie znaczenia säów lub ich powiñzania z Ĕyciem danej osoby
wymagaäoby znacznie wiökszej iloĈci informacji niĔ ta, do której mogñ uzyskaè dostöp filtry
spamu w swojej obecnej postaci.

Poza tym, choè wszystkie metody uczenia maszynowego róĔniñ siö pod tym wzglödem, sñ po-

datne na moĔliwoĈè przesadnego uogólniania. Jak z wiökszoĈciñ rzeczy w Ĕyciu, duĔe uogól-
nienia oparte na kilku przykäadach rzadko sñ w peäni dokäadne. Z pewnoĈciñ moĔliwe jest
otrzymanie od znajomego waĔnej wiadomoĈci e-mail, która zawiera säowa „apteka interneto-
wa”. W tym przypadku poinstruowano by algorytm, Ĕe wiadomoĈè nie jest spamem. W rezul-
tacie algorytm mógäby wywnioskowaè, Ĕe komunikaty od tego konkretnego znajomego sñ moĔ-
liwe do zaakceptowania. Natura wielu algorytmów uczenia maszynowego jest taka, Ĕe mogñ
one kontynuowaè proces uczenia wraz z pojawianiem siö nowych informacji.

Rzeczywiste przykĥady

W Internecie istnieje wiele witryn, które obecnie gromadzñ dane od wielu róĔnych osób, a po-
nadto stosujñ uczenie maszynowe i metody statystyczne w celu skorzystania z nich. Wyszuki-

warka Google to prawdopodobnie najwiöksze rozwiñzanie (nie tylko uĔywa äñczy internetowych
do tworzenia rankingu stron, ale nieustannie zbiera informacje dotyczñce momentu klikniöcia re-
klam przez róĔnych uĔytkowników), które umoĔliwia firmie Google bardziej skuteczne kierowa-
nie reklam. W rozdziale 4. zostanñ omówione wyszukiwarki internetowe i algorytm Page-
Rank, który stanowi istotnñ czöĈè systemu rankingowego wyszukiwarki Google.

Inne przykäady obejmujñ witryny internetowe z systemami rekomendacji. Witryny takich firm,
jak Amazon i Netflix, uĔywajñ informacji o rzeczach kupionych lub wypoĔyczonych przez

ludzi do okreĈlania, jacy internauci lub jakie produkty sñ do siebie podobne, a nastöpnie tworze-
nia rekomendacji na podstawie historii zakupów. Inne witryny, takie jak Pandora i Last.fm,
stosujñ oceny uĔytkowników dotyczñce róĔnych zespoäów i piosenek, aby tworzyè tematyczne

Kup książkę

Poleć książkę

Inne zastosowania algorytmów uczécych

stacje radiowe z muzykñ, która w opinii ich wäaĈcicieli powinna byè interesujñca. W roz-
dziale 2. omówiono metody budowania systemów rekomendacji.

Rynki prognostyczne

to takĔe forma inteligencji zbiorowej. Jednym z najbardziej znanych jest

serwis Hollywood Stock Exchange (http://hsx.com/), w którym uĔytkownicy handlujñ akcjami

zwiñzanymi z filmami i gwiazdami filmowymi. MoĔliwe jest kupno lub sprzedaĔ akcji po ak-
tualnej cenie, jeĈli wiadomo, Ĕe jej ostateczna cena bödzie jednñ milionowñ rzeczywistej kwoty
w momencie premiery filmu. Ze wzglödu na to, Ĕe cena jest zaleĔna od handlujñcych akcjami,
jej wysokoĈè nie jest ustalana przez Ĕadnñ konkretnñ osobö, lecz jako wynik dziaäania grupy.
Aktualna cena moĔe byè przewidywaniem caäej grupy dotyczñcym wyniku finansowego filmu
po premierze. Przewidywania okreĈlane przez serwis Hollywood Stock Exchange sñ czösto
lepsze od opracowywanych przez poszczególnych ekspertów.

Niektóre serwisy randkowe, takie jak eHarmony, uĔywajñ informacji zebranych od uczestników
do okreĈlenia, kto byäby odpowiednim kandydatem. Choè takie firmy utrzymujñ zwykle sto-
sowane metody dopasowywania osób w tajemnicy, caäkiem prawdopodobne jest, Ĕe dowolna
skuteczna metoda bödzie uwzglödniaè ciñgäe ponawianie oceny na podstawie tego, czy wybra-
ni kandydaci faktycznie zostali do siebie pomyĈlnie dopasowani.

Inne zastosowania algorytmów uczécych

Metody opisane w ksiñĔce nie sñ nowe. Choè przykäady skupiajñ siö na problemach z inteligen-
cjñ zbiorowñ w przypadku zastosowaþ internetowych, znajomoĈè algorytmów uczenia maszy-
nowego moĔe okazaè siö pomocna dla twórców oprogramowania w wielu innych dziedzi-
nach. Algorytmy te sñ szczególnie przydatne w obszarach, w których wykorzystuje siö duĔe

zbiory danych przeszukiwane pod kñtem interesujñcych wzorców. Oto przykäady.

Biotechnologia

Postöpy w technologii sekwencjonowania i badania przesiewowego spowodowaäy utwo-
rzenie ogromnych zbiorów róĔnych rodzajów danych, takich jak sekwencje kodu DNA,
struktury biaäek, przesiewy zwiñzków chemicznych i ekspresja RNA. Techniki uczenia
maszynowego sñ intensywnie wykorzystywane w przypadku wszystkich tego rodzaju
danych. Ma to na celu znalezienie wzorców, które zwiökszajñ stopieþ zrozumienia proce-
sów biologicznych.

Wykrywanie oszustw finansowych

Firmy obsäugujñce karty kredytowe nieustannie poszukujñ nowych sposobów wykrywania
nielegalnych transakcji. W zwiñzku z tym zastosowaäy one takie techniki, jak sieci neuro-
nowe i logika indukcyjna, aby weryfikowaè transakcje i wychwytywaè przypadki nie-
wäaĈciwego uĔycia.

System wizyjny

Interpretowanie obrazów z kamery wideo do celów wojskowych lub obserwacyjnych to ak-
tywny obszar badaþ. Wiele technik uczenia maszynowego uĔywanych jest w celu podejmo-

wania próby automatycznego wykrywania intruzów, identyfikowania pojazdów lub rozpo-
znawania twarzy. Szczególnie interesujñce jest zastosowanie technik nienadzorowanych,
takich jak niezaleĔna analiza komponentów, która umoĔliwia znajdowanie interesujñcych wäa-
ĈciwoĈci w duĔych zbiorach danych.

Kup książkę

Poleć książkę

Rozdziaĥ 1. Inteligencja zbiorowa — wprowadzenie

Marketing produktów

Przez bardzo däugi czas zrozumienie demografii i trendów byäo bardziej formñ sztuki niĔ
naukñ. Zwiökszona w ostatnim czasie moĔliwoĈè gromadzenia danych od konsumentów
zapewniäa opcje wykorzystania technik uczenia maszynowego, takich jak grupowanie, aby
lepiej zrozumieè naturalne podziaäy istniejñce na rynkach i przygotowaè precyzyjniejsze

przewidywania dotyczñce przyszäych trendów.

Optymalizacja äaþcucha dostaw

DuĔe organizacje mogñ zaoszczödziè miliony dolarów dziöki efektywnemu funkcjonowa-
niu ich äaþcuchów dostaw i dokäadnemu przewidywaniu zapotrzebowania na produkty
w róĔnych obszarach. Liczba moĔliwych metod tworzenia äaþcucha dostaw jest ogromna,
tak samo jak liczba czynników, które potencjalnie mogñ mieè wpäyw na popyt. Optymalizacja
i techniki uczenia sñ czösto uĔywane do analizowania zwiñzanych z tym zbiorów danych.

Analiza rynków gieädowych

Od czasu powstania rynku gieädowego ludzie podejmowali próby wykorzystania matematy-
ki do zarobienia wiökszej iloĈci pieniödzy. Wraz z coraz wiökszym stopniem zaawansowa-
nia uczestników rynku akcji staäo siö konieczne analizowanie wiökszych zbiorów danych
i uĔywanie zaawansowanych technik do wykrywania wzorców.

Bezpieczeþstwo narodowe

Ogromna iloĈè informacji jest gromadzona przez agencje rzñdowe caäego Ĉwiata. Analiza
tych danych wymaga od komputerów wykrywania wzorców i wiñzania ich z potencjalny-
mi zagroĔeniami.

To zaledwie kilka przykäadów intensywnego wykorzystywania uczenia maszynowego. Z po-
wodu tego, Ĕe tendencjñ jest generowanie wiökszej iloĈci informacji, prawdopodobnie w wiök-
szej liczbie dziedzin konieczne bödzie wykorzystanie uczenia maszynowego i metod staty-
stycznych, gdy iloĈè informacji przekroczy ludzkie moĔliwoĈci zarzñdzania nimi przy uĔyciu
starych sposobów.

Biorñc pod uwagö, jak duĔo nowych informacji udostöpnianych jest kaĔdego dnia, oczywiĈcie
pojawia siö znacznie wiöcej moĔliwoĈci. Po poznaniu kilku algorytmów uczenia maszynowe-

go zacznñ byè zauwaĔalne przeróĔne miejsca, w których mogñ one zostaè wykorzystane.

Kup książkę

Poleć książkę

324 _ Skorowidz

Skorowidz

Akismet, 16, 152

aktualizowanie multiplikatywne,

244

algorytm, 23, 281

backpropagation,

Patrz:

algorytm wstecznej

propagacji bäödów

CART, Patrz: CART

filtrowania grupowego,

Patrz:

filtrowanie grupowe

genetyczny, 113, 116, 256, 308

kNN, Patrz: kNN

NMF, Patrz: macierz

faktoryzacja nieujemna

PageRank, Patrz: PageRank

sprzöĔenia wyprzedzajñcego, 96

syntetyzujñcy inteligencjö

zbiorowñ, 16

transparentny, 23

uczenia maszynowego,

Patrz:

uczenie maszynowe

wstecznej propagacji bäödów,

93, 97

wybór, 209, 255

wyodröbniania wäaĈciwoĈci,

Patrz:

dane wäaĈciwoĈè

wyodröbnianie

wyróĔniania rdzeni

wyrazów, 79

wyszukiwania

peänotekstowego, 73

zmieniajñcy wagi poäñczeþ

miödzy wözäami,
Patrz:

algorytm wstecznej

propagacji bäödów

Amazon, 24, 27

analiza

komponentów niezaleĔna, 25

korelacji, 24

rynków gieädowych, 26

API, 16, 23, 39, 173, 176, 201, 227
Application Programming Interface,

Patrz:

API

backpropagation, Patrz: algorytm

wstecznej propagacji bäödów

Bayesa twierdzenie,

Patrz:

twierdzenie Bayesa

baza danych

indeksu peänotekstowego, 77
klient-serwer, 74
pysqlite, Patrz: pysqlite
SQLite, 74, 77, 147

Beautiful Soup, 64, 75, 312
biblioteka

Beautiful Soup, Patrz:

Beautiful Soup

jözyka Python, 16
LIBSVM, Patrz: LIBSVM
matplotlib, 198
NumPy, Patrz: NumPy
PIL, 57, 128, 311
pydelicious, 316
urllib2, 75

biologia obliczeniowa, 49
bliskoĈè, 54
blog, 49, 50, 52

filtrowanie, 148

CART, 160
cena, 181, 205, 206, 207

licytacji, 181

centroid, 62
Classification and Regression

Trees, Patrz: CART

dane, Patrz teĔ: baza danych, zbiór

brakujñce, 171
demograficzne, 49
gromadzenie, 23
grupowanie, 49, 50, 54
liczbowe, 217
macierz, Patrz: macierz

artykuäów

nieliniowoĈè, 211
przeksztaäcenie w liczby, 217
skalowanie, 193, 194, 218, 297

optymalizacja, 194

transformacja do nowej

przestrzeni, 221, 293

wäaĈciwoĈci wyodröbnianie,

233, 235

wzajemna zaleĔnoĈè

zmiennych, 211

del.icio.us, 16, 38, 39, 316
demografia, 26
dendrogram, 57, 60
Document Object Model,

Patrz:

DOM

dokument

gromadzenie, 73
klasyfikacja, 133
tabela, 73, 78
XML, 51

DOM, 118
domena rozwiñzania, 308
drzewo, 258

decyzyjne, 23, 49, 157, 159,

168, 169, 172, 178, 181, 212,
285, 287
brakujñce dane, 171
nadmiernie dopasowane,

169, 170

przycinanie, 169, 170
rekurencyjne, 164

Kup książkę

Poleć książkę

Skorowidz _ 325

uczenie, 160, 285
wady, 287
wyĈwietlanie, 166, 167
zalety, 287

gäöbokoĈè, 263
rekurencyjne, 258
reprezentacja, 259
skäadni, 258
wözeä, 259

przechowywania, 277

wyĈwietlanie, 261

eBay, 16, 200, 202

Quick Start Guide, 201

eHarmony, 25
elitaryzm, 113
e-mail

dystrybucja masowa, 158
identyfikowanie, 133

entropia, 163, 164, 170, 321

przyrost informacji, 164

Facebook, 227

klucz programisty, 227

sesja, 228
znajomy, 229, 230

faktoryzacja macierzy,

Patrz:

macierz faktoryzacja

filtrowanie

bayesowskie, 50, 139, 140, 141,

154, 157, 158, 181, 238, 281,
283
wady, 284
zalety, 284

grupowe, 28, 42, 46, 47
poczty elektronicznej, 23
spamu, Patrz: spam

filtrowanie

Fishera metoda, Patrz: metoda

Fishera

funkcja

bazowa radialna, 221, 222
entropii, Patrz: entropia
Gaussa, 188, 322
kosztu, 106, 124, 130, 244, 307,

308

niejednorodnoĈci Giniego,

Patrz:

niejednorodnoĈè

Giniego

odejmowania, 187
odwrotna, 186

okreĈlania wag, 100
pow, 30
przydatnoĈci, 256
sigmoidalna, 96
tangensa hiperbolicznego, 95
waĔona kNN, 189, 322

Gaussa funkcja, Patrz: funkcja

Gaussa

generacja, 113, 256, 308

poczñtkowa, 261

Goldberg David, 28
Google, 21, 22, 24, 88
granica decyzyjna, 212
gromadzenie dokumentów, 73
GroupLens, 45
grupowanie, 233, 238

danych, Patrz: dane

grupowanie

hierarchiczne, 53, 55, 57, 61,

299, 300, 302

kolumn, 59
k-Ĉrednich, 62, 299, 301
wierszy, 59

hill climbing, Patrz: metoda

najwiökszego wzrostu

hiperpäaszczyzna z

maksymalnym marginesem, 223

hodowanie, Patrz: krzyĔowanie
Holland John, 116
Hollywood Stock Exchange, 25
Hot or Not, 16, 176
HTML, 79

iloczyn skalarny, 215, 216, 221,

222, 293, 322

implementacja referencyjna, 14
indeks peänotekstowy, 77, 79, 80

inteligencja

rozwojowa, 255
sztuczna, 23

w grze, 272

zbiorowa, 22, 25, 249, 255

interfejs

Akismet, Patrz: Akismet
API, Patrz: API

Jaccarda wspóäczynnik,

Patrz:

wspóäczynnik Jaccarda

jözyk

Lisp, 258
Python, Patrz: Python
XML, Patrz: XML

kanaä informacyjny

Atom, 51, 234
RSS, 51, 234

filtrowanie, 148

Kayak, 16, 117, 119
k-centroid, 62
klaster, 55, 57

bäñd caäkowity, 58
Ĉrodek, 62
wysokoĈè, 58

klasyfikacja

odnoĈników zewnötrznych,

82, 87, 88, 91

oparta na treĈci, 82, 83

klasyfikator, 135, 146, 153, 209, 238

bayesowski, 140, 154, 157, 181,

238, 281, 283
naiwny, 139, 142, 143, 146
uczenie, 282
wady, 284
zalety, 284

drzew decyzyjnych,

Patrz:

drzewo decyzyjne

Fishera, Patrz: metoda Fishera
liniowy, 213, 214, 216, 220, 293
oparty

na reguäach, 133, 134, 141
na wäaĈciwoĈci, 134, 141, 145

k-Nearest Neighbors, Patrz: kNN
kNN, 183, 185, 196, 207, 296, 298

wady, 299

wagi, 186, 189, 196, 298
zalety, 299

kodu wciöcie, 15
korelacja Pearsona, 29, 31, 32, 33,

35, 54, 66, 317

krzywa

dzwonowa, 188, 322
normalna, Patrz: krzywa

dzwonowa

krzyĔowanie, 256, 258, 267, 308
k-Ĉrednia, 62, 183

Kup książkę

Poleć książkę

326 _ Skorowidz

Last.fm, 24

LIBSVM, 225, 226, 295

linia

najlepszego dopasowania, 32

podziaäu, 212, 216, 219, 221,

223, 224, 292

lista, 15

logika indukcyjna, 25

macierz, 240

aktualizacji, 244

artykuäów, 241, 244

wyĈwietlanie, 247

danych, Patrz: macierz

artykuäów

faktoryzacja nieujemna, 50,

240, 241, 242, 243, 249, 251,

305, 306

mnoĔenie, 240, 243, 305

obserwacji, 251

transpozycja, 241, 243

wag, 241, 242, 243, 305

wäaĈciwoĈci, 241, 243, 305

wyĈwietlanie, 246, 252

maksimum lokalne, 271

mapa samoorganizujñca siö, 50

maszyna wektorów noĈnych, 50,

181, 209, 223, 224, 225, 226, 231, 292

wady, 295

zalety, 295

matplotlib, 315

metoda

Fishera, 142, 145

k-najbliĔszych sñsiadów,

Patrz:

kNN

modyfikowania rozwiñzaþ, 113

najwiökszego wzrostu, 109

oparta na wektorach

i iloczynach skalarnych, 214

metryka czöstoĈci wyrazów, 84, 85,

miara

odlegäoĈci, 302

podobieþstwa, 29, 31, 32, 33,

35, 44, 54, 319

stopnia niejednorodnoĈci, 320

waĔona, 34, 186, 189

MLP, 92

model

myĈlowy, 23

przewidujñcy ceny, 181, 186,

190, 191, 192, 193, 195, 196,

198, 205, 206, 207

Multilayer Perceptron, Patrz: MLP
mutacja, 113, 256, 258, 265, 308

nawigowanie, Patrz:

przeszukiwanie

Netflix, 21, 24
niejednorodnoĈè Giniego, 162, 163,

320

NMF, Patrz: macierz faktoryzacja

nieujemna

Non-Negative Matrix

Factorization, Patrz: macierz
faktoryzacja nieujemna

NumPy, 242, 314

ocena, 83, 88

czöstoĈci wystöpowania

wyrazów, 83

liczbowa, 84
lokalizacja w dokumencie, 83
normalizacja, 84
odlegäoĈè miödzy wyrazami, 83

odlegäoĈè

euklidesowa, 29, 33, 35, 54,

184, 317

Manhattan, 33
miödzy wyrazami, 83

odnoĈnik zewnötrzny, 82
optymalizacja, 103, 122, 125, 130,

307, 309

algorytm genetyczny, Patrz:

algorytm genetyczny

funkcja kosztu, Patrz: funkcja

kosztu

äaþcucha dostaw, 26
metoda najwiökszego

wzrostu, Patrz: metoda
najwiökszego wzrostu

podróĔy grupy osób, 104, 117,

122

presja ewolucyjna,

Patrz:

presja ewolucyjna

reprezentowanie rozwiñzania,

105, 123, 125, 126, 130

stochastyczna, 103
wyszukiwanie losowe,

Patrz:

wyszukiwanie losowe

wyĔarzanie symulowane,

Patrz:

wyĔarzanie

symulowane

Page Larry, 88
PageRank, 23, 24, 88, 89
pakiet minidom, 118
Pandora, 24
plik HTML, 79
poczty elektronicznej filtrowanie,

populacja, Patrz: generacja

Porter Stemmer, 79
prawdopodobieþstwo, 319

göstoĈè, 196, 198, 322
skumulowane, 198
warunkowe, 320

presja ewolucyjna, 256
problem koktajlowy, 233
program

krzyĔowanie,

Patrz:

krzyĔowanie

miara sukcesu, 264, 269
mutacja, Patrz: mutacja
reprezentacja drzewa,

Patrz:

drzewo

programowanie

funkcyjne, 14
genetyczne, 116, 255, 256, 257

funkcje, 276
gra, 272, 274, 275
pamiöè, 277
program, Patrz: program
ranking programów, 271
Ĉrodowisko, 269, 277
test, 263, 264

obiektowe, 14
proceduralne, 14

przeszukiwanie, 73, 75, 80, 81, 83,

84, 85, 86, 87

przewidywanie liczbowe, 181
przyrost informacji, 164

punkt Ĉredniej, 213
pysqlite, 313
Python, 14, 15
Python Imaging Library, Patrz:

biblioteka PIL

regresja, 24
reguäa aktualizowania

multiplikatywnego, 244

rekomendacja, 27, 36

odnoĈników, 38, 41
sñsiadów, 41
tworzenie, 43

Kup książkę

Poleć książkę

Skorowidz _ 327

rynek

finansowy, 22, 249, 250

wolumen obrotów, 249, 250

kontraktów terminowych, 22

prognostyczny, 25

serwis randkowy, 25, 176, 209

sieè neuronowa, 23, 25, 49, 74, 92,

157, 158, 288, 291

definicja, 93

funkcja sigmoidalna, 96

funkcja tangensa

hiperbolicznego, 95

neuron, Patrz: sieè neuronowa

wözeä

perceptronu

wielowarstwowego,
Patrz:

MLP

sztuczna, 92, 100, 153

Ĉledzñca klikniöcia, 92

uczenie, 93, 99, 290

wady, 292

warstwa ukryta, Patrz:

warstwa ukryta

wözeä, 92, 94

zalety, 292

skalowanie wielowymiarowe, 68,

303, 304

säownik, 15, 39, 40

identyfikatorów adresów

URL, 84

ocen, 84

zagnieĔdĔony, 28

spam, 23, 133

filtrowanie, 24, 133

äñczenie

prawdopodobieþstw, 139,

144

obliczanie

prawdopodobieþstwa,

137, 138, 139, 140, 141, 142

oparte na reguäach, 133

uczenie siö, 134, 135, 138,

139, 140, 142, 146, 147

klasyfikator, Patrz: klasyfikator

WordPress, 152

SpamBayes, 142

strona

internetowa, 75

ocena, Patrz: ocena

Support Vector Machine, Patrz:

maszyna wektorów noĈnych

SVM, Patrz: maszyna wektorów

noĈnych

system rekomendacji, 24

Ĉrednia

punkt, Patrz: punkt Ĉredniej
waĔona, 189, 318

ĈwiadomoĈè zbiorowa, 22

tabela

dokumentów, 73, 78
indeks, 94

tangens hiperboliczny,

Patrz:

funkcja tangensa

hiperbolicznego

Tanimoto wspóäczynnik,

Patrz:

wspóäczynnik Tanimoto

Tapestry, 28
technika nienadzorowana,

Patrz: uczenie nienadzorowane

tekst odnoĈników, 91
transformacja wielomianowa, 293
trik jñdrowy, 221, 224, 293, 294
twierdzenie Bayesa, 140

uczenie

maszynowe, 14, 16, 23, 25, 159

grupowanie, 26
ograniczenia, 24

nadzorowane, 49, 153, 233,

238

nienadzorowane, 50, 233, 299,

302

za pomocñ drzew

decyzyjnych, Patrz: drzewo
decyzyjne

Universal Feed Parser, 51, 234, 311

walidacja krzyĔowa, 189, 206
wariancja, 321
warstwa

ukryta, 92, 94

zapytaþ, 92

wektor, 214, 221, 322
wiadomoĈè e-mail, Patrz: e-mail
wiersz

poleceþ, 14
zachöty, 14

Wikipedia, 22
witryna spoäecznoĈciowa, 64, 316
wizualizacja sieci, 125

wolumen obrotów, 249, 250
WordPress, 152
wspóäczynnik

Jaccarda, 33
korelacji Pearsona,

Patrz:

korelacja Pearsona

Tanimoto, 66, 319
täumienia, 88

wtyczka SpamBayes,

Patrz:

SpamBayes

wykres punktowy, 211
wyraĔenie listowe, 15, 34
wyszukiwanie

losowe, 108, 109
peänotekstowe, 73

wyszukiwarka, 88

Kayak, Patrz: Kayak
peänotekstowa, 73
rejestrowanie klikniöè, 91

wyĔarzanie symulowane, 111,

128, 244, 308

Xerox PARC, 28
XML, 14, 51

Yahoo! Finance, 249, 250

zakäadka, 38
zapytanie klasyfikowanie, 74
zbiór

testowy, 189
uczñcy, 189
zmiennych

heterogenicznych, 191
nieistotnych, 192, 193

zbiór danych

budowanie, 40, 42
MovieLens, 45

Zebo, 64, 65

Zillow, 173
zmienna

heterogeniczna, 191
nieistotna, 192, 193, 297
wzajemna zaleĔnoĈè, 211

znacznik, 42
zupa, 64

Kup książkę

Poleć książkę

Wyszukiwarka

Podobne podstrony:
Nowe uslugi 2 0 Przewodnik po analizie zbiorow danych noweus
Nowe uslugi 2 0 Przewodnik po analizie zbiorow danych
Nowe uslugi 2 0 Przewodnik po analizie zbiorow danych
Nowe uslugi 2 0 Przewodnik po analizie zbiorow danych 2
przeprowadzenie analizy bazy danych uslugi AD, Informatyka HELP
Serwer SQL 2008 Uslugi biznesowe Analiza i eksploracja danych ss28ub
Tabele i wykresy przestawne od A do Z dynamiczna analiza duzych zbiorow danych e d05x
Przewodnik po sztuce uczenia literatury Bortnowski
Przewodnik po Wloclawku
plik,382,465,przewodnik po funduszach strukturalnych dla msp na lata 2007 2013

więcej podobnych podstron