Nasz system (2.1) składa się z:
• bota internetowego, pobierającego dane w sposób automatyczny
• aplikacji matlabowej przetwarzającej zgromadzone dane.
Dane o publikacjach, patentach, zainteresowaniach pobierane są z sieci Internet z wybranych serwerów. Niektóre dane zostały pozyskane manualnie. Po wstępnym przetworzeniu dane gromadzone są w bazie wiedzy, wykorzystywanej przez moduł główny aplikacji.
W module głównym wykonywana jest weryfikacja i selekcja danych do użycia ich do obliczeń prognoz. Po wstępnej ocenie generowane są wzory empiryczne na wartości zmiennych opisywanych zależnych od zmiennych opisujących. Z otrzymanych wzorów tworzone są prognozy, a na ich podstawie generowane są raporty, które znajdą się w rozdziale 3.
Projekt zaimplementowany został z użyciem technologii i języków:
• Java
• Matlab
W przetwarzaniu inormacji przydatne okazały się technologie skryptowe języków Python, Perl, Bash, w tym wyrażenia regularne.
Dane wczytywane są do programu przy wykorzystaniu serwera komunikacyjnego COM opracowanego przez firmę Microsoft wbudowanego w program Microsoft Office.
Matlab przy wykorzystaniu funkcji xlsread łączy się z wyżej wymienionym serwerem stając się w stosunku do niego klientem i odbiera odczytane przez niego dane.
Serwer COM zwraca dane w postaci obiektu posiadającego dwa pola; nagłówek, dane, zgodnie z filozofią bazy danych dla Microsoft Excel:
• nagłówek: typ tekstowy, dane nierozdzielne pustą kolumną, koniec nagłówka poprzez rozpoczęcie danych liczbowych,
• dane: typy liczbowe zdefiniowane przez arkusz programu Excel, dane nierozdzielne pustą kolumną, koniec danych sygnalizuje pusty wiersz. Powyższe zastrzeżenie sprawia, że Matlab tworzy tablicę zawierającą dwa wiersze; tekstową tablicę nagłówka, liczbową tablicę danych.
Importując dane tworzona jest tablica wektorów zawierająca wektory będące strukturami zawierającymi następujące pola:
• nazwa
7