Podatkovno rudarjenje išče skrite, veljavne in vse možne uporabne vzorce v velikih naborih podatkov. Data Mining je tehnika, ki vam pomaga odkriti neslutena / neodkrita razmerja med podatki za poslovne dobičke.
Za podatkovno rudarjenje je na voljo veliko uporabnih orodij. Sledi izbrani seznam najboljših 25 izbranih programov za rudarjenje podatkov s priljubljenimi funkcijami in najnovejšimi povezavami za prenos. Ta primerjalni seznam vsebuje odprta in komercialna orodja.
1) SAS podatkovno rudarjenje:
Sistem statistične analize je produkt SAS. Razvit je bil za analitiko in upravljanje podatkov. Ponuja grafični uporabniški vmesnik za netehnične uporabnike.
Lastnosti:
- Orodja za podatkovno rudarjenje SAS vam pomagajo analizirati velike podatke
- Je idealno orodje za podatkovno rudarjenje, besedilo in optimizacijo besedil.
- SAS ponuja zelo razširljivo arhitekturo obdelave porazdeljenega pomnilnika
Povezava za prenos: https://www.sas.com/en_us/insights/analytics/data-mining.html
2) Teradati:
Teradata je množično vzporedno odprt sistem obdelave za razvoj obsežnih aplikacij za skladiščenje podatkov. Teradata lahko deluje na strežniški platformi Unix / Linux / Windows.
Lastnosti:
- Teradata Optimizer lahko v poizvedbi obdela do 64 združitev.
- Podatki Tera imajo nizke skupne stroške lastništva. Enostavno je nastaviti, vzdrževati in upravljati.
- Podpira SQL za interakcijo s podatki, shranjenimi v tabelah. Zagotavlja njegovo podaljšanje.
- Pomaga vam pri samodejni distribuciji podatkov na diskete brez ročnega posredovanja.
- Teradata ponuja pripomočke za nalaganje in razkladanje za premikanje podatkov v / iz sistema Teradata.
Povezava za prenos: https://www.teradata.in/Products/Cloud/IntelliCloud
3) R-programiranje
R je jezik za statistično računalništvo in grafiko. Uporabljala se je tudi za analizo velikih podatkov. Zagotavlja široko paleto statističnih testov.
Lastnosti:
- Učinkovita naprava za obdelavo in shranjevanje podatkov,
- Zagotavlja niz operaterjev za izračune na nizih, zlasti matrike,
- Zagotavlja skladno, integrirano zbirko orodij za velike podatke za analizo podatkov
- Ponuja grafične pripomočke za analizo podatkov, ki se prikažejo na zaslonu ali na papirju.
Povezava za prenos; https://www.r-project.org/
4) DESKA
Board je zbirka Management Intelligence Toolkit. Združuje funkcije poslovne inteligence in upravljanja uspešnosti podjetja. Zasnovan je za zagotavljanje poslovne inteligence in poslovne analitike v enem paketu.
Lastnosti:
- Omogoča analizo, simulacijo, načrtovanje in predvidevanje z uporabo ene same platforme
- Za izdelavo prilagojenih analitičnih aplikacij in aplikacij za načrtovanje.
- Board All-In-One združuje BI, upravljanje uspešnosti podjetja in poslovno analitiko.
- Podjetjem omogoča razvoj in vzdrževanje izpopolnjenih analitičnih in načrtovalnih aplikacij.
- Zaščitena platforma pomaga pri poročanju z dostopom do več virov podatkov.
Povezava za prenos: https://www.board.com/en
5) Dunde
Dundas je orodje za podatkovno rudarjenje, pripravljeno za podjetja, ki ga lahko uporabite za izdelavo in ogled interaktivnih nadzornih plošč, poročil itd. Dundas BI lahko namestite kot osrednji podatkovni portal organizacije.
Lastnosti:
- Strežniška aplikacija s popolno funkcionalnostjo izdelka
- Vključite in dostopajte do vseh vrst podatkovnih virov
- Prilagodljive vizualizacije podatkov
- Pametna orodja za povleci in spusti
- Vizualizirajte podatke na zemljevidih
- Napovedovalna in napredna analitika podatkov
Povezava za prenos: http://www.dundas.com/support/dundas-bi-free-trial
6) Inetsoft
Inetsoft-ov Orodje za podatkovno rudarjenje Intelligence je uporabna podatkovna baza in obveščevalna platforma. Omogoča hitro in prilagodljivo preoblikovanje podatkov iz različnih virov.
Lastnosti:
- Pomaga vam pri dostopu do strukturiranih in polstrukturiranih virov, lokalnih aplikacij
- Omogoča optimizacijo aplikacij za porabo in posodabljanje podatkov
- Ponudite prilagojene in varne ravni raziskovanja in poročanja podatkov.
- Povečajte obseg podatkovnih nizov uporabnikov s pomočjo platforme Inbuilt Spark
- Ustvarite paginirana poročila z vdelano poslovno logiko in parametrizacijo
Povezava za prenos: https://www.inetsoft.com/products/StyleIntelligence/
7) H3O
H3O je še eno odlično odprtokodno orodje za rudarjenje podatkov. Uporablja se za analizo podatkov na podatkih v aplikacijskih sistemih za računalništvo v oblaku.
Lastnosti:
- H3O vam omogoča, da izkoristite računalniško moč porazdeljenih sistemov in računalništvo v pomnilniku
- Omogoča hitro in enostavno uvajanje v proizvodnjo z Javo in binarnim formatom.
- Pomaga vam pri uporabi programskih jezikov, kot je R,
- Python in drugi za izdelavo modela v H3O
- Porazdeljena obdelava v pomnilniku
Povezava za prenos: https://www.h3o.ai/
8) Qlik
Qlik je orodje za podatkovno rudarjenje in vizualizacijo. Ponuja tudi nadzorne plošče in podpira več virov podatkov in vrst datotek.
Lastnosti:
- Povlecite in spustite vmesnike, da ustvarite prilagodljive, interaktivne vizualizacije podatkov
- Takoj se odzovite na interakcije in spremembe.
- Podpira več virov podatkov in vrst datotek
- Omogoča enostavno varnost podatkov in vsebine v vseh napravah.
- Omogoča vam izmenjavo ustreznih analiz, vključno z aplikacijami in zgodbami, z uporabo centraliziranega vozlišča.
Povezava za prenos: https://www.qlik.com/us/products/qlik-sense
9) RapidMiner:
RapidMiner je brezplačno orodje za podatkovno rudarjenje. Uporablja se za pripravo podatkov, strojno učenje in uvajanje modelov. Ponuja vrsto izdelkov za izdelavo novih procesov rudarjenja podatkov in napovedne analize nastavitev.
Lastnosti:
- Dovoli več načinov upravljanja podatkov
- GUI ali serijska obdelava
- Integrira se z lastnimi zbirkami podatkov
- Interaktivne nadzorne plošče, ki jih je mogoče deliti z drugimi
- Napovedovalna analitika Big Data
- Obdelava analize na daljavo
- Filtriranje, združevanje in združevanje podatkov
- Izdelajte, usposobite in potrdite napovedne modele
- Poročila in sprožena obvestila
Povezava za prenos: https://my.rapidminer.com/nexus/account/index.html#downloads
10) Oracle BI
Oracle BI je odprtokodno strojno učenje in vizualizacija podatkov za začetnike in strokovnjake. Potek interaktivne analize podatkov z veliko zbirko orodij.
Lastnosti:
- Interaktivna vizualizacija podatkov.
- Ponuja interaktivno raziskovanje podatkov za hitro kvalitativno analizo s čistimi vizualizacijami.
- Oranžna podpira praktično usposabljanje in vizualne ilustracije konceptov iz znanosti o podatkih.
- Ponuja široko paleto dodatkov za rudarjenje podatkov iz zunanjih virov podatkov.
Povezava za prenos: https://orange.biolab.si/
11) KNIME
KNIME je odprtokodna programska oprema za ustvarjanje aplikacij in storitev za podatkovne vede. To orodje za podatkovno rudarjenje vam pomaga razumeti podatke in oblikovati poteke v znanosti o podatkih.
Lastnosti:
- Pomaga vam pri oblikovanju poteka dela s področja znanosti o podatkih
- Združi podatke iz katerega koli vira
- Omogoča združevanje, razvrščanje, filtriranje in združevanje podatkov na vašem lokalnem računalniku, v zbirki podatkov ali v razporejenih okoljih velikih podatkov.
- Izdelajte modele strojnega učenja za klasifikacijo, regresijo, zmanjšanje dimenzij
Povezava za prenos: https://www.knime.com/software-overview
12) Tanagra
Tangra je brezplačno orodje za podatkovno rudarjenje za študijske in raziskovalne namene. Ponuja različne metode rudarjenja podatkov od statističnega učenja, analize podatkov in strojnega učenja.
Lastnosti:
- Ponuja programsko opremo za podatkovno rudarjenje, enostavno za uporabo, za raziskovalce in študente
- Uporabniku omogoča, da doda svoje metode rudarjenja podatkov.
Povezava za prenos: https://eric.univ-lyon2.fr/~ricco/tanagra/en/tanagra.html
13) Reševalec:
Solverjev XLminer je enostaven za uporabo na profesionalni ravni orodje za rudarjenje podatkov za vizualizacijo podatkov, napovedovanje in rudarjenje podatkov v Excelu. Ponuja obsežen nabor funkcij za pripravo podatkov za uvoz in čiščenje podatkov.
Lastnosti:
- XLMiner ponuja obsežen nabor analiznih funkcij, ki temeljijo na statističnih metodah in metodah strojnega učenja.
- Orodje vam omogoča delo z velikimi nabori podatkov, ki lahko presegajo omejitve v Excelu.
- Ponuja vgrajene funkcije za raziskovanje in vizualizacijo podatkov.
- Raziskovanje podatkov ponuja hiter vpogled v skrite odnose v podatkih.
Povezava za prenos: https://www.solver.com/xlminer-data-mining
14) Sisense
Sisense je še eno učinkovito orodje za podatkovno rudarjenje. Takoj analizira in vizualizira tako velike kot raznolike nabore podatkov. Je idealno orodje za ustvarjanje nadzornih plošč z najrazličnejšimi vizualizacijami.
Lastnosti:
- Omogoča izdelavo interaktivnih nadzornih plošč brez tehničnih veščin
- Ustvarite eno različico resnice z brezhibnimi podatki
- Povezite nepovezane podatke na eno centralizirano mesto
- Vhodni uporabniški vmesnik povleci in spusti
- Omogoča dostop do nadzornih plošč tudi v mobilni napravi
- Privlačna vizualizacija
- S filtriranjem in izračuni prepoznava kritične meritve
- Obdeluje velike podatke na enem samem blagovnem strežniku
Povezava za prenos: https://www.sisense.com/
15) Tajanje podatkov
DataMelt je brezplačno orodje za numerično računanje, matematiko, analizo podatkov in vizualizacijo podatkov. Ta program vam ponuja preprostost skriptnih jezikov, kot so Python, Ruby, Groovy, z močjo na stotine paketov Java.
Lastnosti:
- DataMelt ponuja statistiko, analizo velike količine podatkov in znanstveno vizualizacijo.
- Uporabite ga lahko z različnimi programskimi jeziki v različnih operacijskih sistemih.
- Omogoča vam ustvarjanje visokokakovostnih vektorsko-grafičnih slik (EPS, SVG, PDF itd.), Ki jih lahko vključite v LaTeX in drug procesor besedila.
- Data Melt ponuja uporabo skriptnih jezikov, ki so bistveno hitrejši od standardnega Pythona, implementiranega v C.
Povezava za prenos: https://jwork.org/dmelt/
16) ELKI:
ELKI je odprtokodno orodje za rudarjenje podatkov, napisano v Javi. Orodje nam omogoča raziskovanje algoritmov s poudarkom na nenadzorovanih metodah pri analizi gruč in odkrivanju odstopanj.
Lastnosti:
- ELKI ponuja obsežno zbirko zelo parametriziranih algoritmov
- Omogoča enostavno in pošteno oceno in primerjalno analizo algoritmov.
- ELKI nudi strukture podatkovnih indeksov, kot je R * -drevo, ki izboljšujejo postopek podatkovnega rudarjenja
Povezava za prenos : https://elki-project.github.io/
17) SPMF
SPMF je odprtokodna knjižnica za rudarjenje podatkov, napisana v Javi. Distribuira se pod licenco GPL. Omogoča integracijo izvorne kode z drugo programsko opremo Java.
Lastnosti:
- Omogoča rudarjenje pravil povezav
- Podpira sekvenčno vzorčenje in zaporedno rudarjenje pravil
- Ponuja visoko uporabno rudarjenje vzorcev,
- Časovne vrste rudarjenja.
- Podpira zapleten postopek združevanja in razvrščanja
Povezava za prenos: http://www.philippe-fournier-viger.com/spmf/
18) Alteryx
Alteryx je rešitev za poslovno inteligenco in analitiko za podjetje. Je posebej zasnovano orodje za analitike podatkov in poslovne voditelje.
Lastnosti:
- Analitika za srednje velika podjetja
- Omogoča ad hoc analizo.
- Ponuja hitro spletno analitično obdelavo
- Samodejno načrtovano poročanje
- Zelo prilagodljiva nadzorna plošča
Povezava za prenos: https://www.alteryx.com/
19) Podjetniški rudar
Enterprise Miner je programska oprema SAS, ki vam ponuja najsodobnejše algoritme, zasnovane za reševanje najpomembnejših izzivov, in ponuja najboljše rešitve za vaše podjetje.
Lastnosti:
- Pomaga vam izboljšati natančnost predvidevanja. Delite zanesljive rezultate
- Enostaven za uporabo GUI in serijska obdelava
- Napredno napovedno in opisno modeliranje
- Ponuja samodejno točkovanje
- Avtomatizirajte uvajanje in točkovanje modelov
Povezava za prenos: https://www.sas.com/en_us/software/enterprise-miner.html
20) Datawatch
Datawatch Desktop je rešitev za podatkovno rudarjenje in poslovno inteligenco. Omogoča vam, da se osredotočite na vizualizacijo podatkov v realnem času. Ponuja orodja za izdelavo in uporabo njihovih sistemov za spremljanje in analizo, ne da bi bilo treba pisati eno vrstico kode.
Lastnosti:
- Funkcija povleci in spusti uporabnikom omogoča, da ustvarijo prilagojen pogled na podatke
- Ugotovite nepravilnosti pri trgovanju
- Z analizo zgodovinskih podatkov analizirajte, kako bodo alternativni scenariji vplivali na uspešnost
Povezava za prenos: https://www.datawatch.com/in-action/panopticon-streaming-analytics-platform/
21) Napredni rudar
Napredni rudar je uporabno orodje za obdelavo podatkov, analizo in modeliranje. Njegov uporabniku prijazen vmesnik poteka dela omogoča raziskovanje različnih vrst podatkov.
Lastnosti:
- Izdvajanje in shranjevanje podatkov iz / v različne sisteme baz podatkov, datoteke in pretvorbe podatkov
- Ponuja različne operacije s podatki, kot so vzorčenje, združevanje naborov podatkov itd.
- Pomaga vam zgraditi statistične modele, analizo spremenljive pomembnosti, analizo grozdov itd.
- Preprosta in učinkovita integracija modelov z zunanjimi aplikacijami IT
Povezava za prenos: https://algolytics.com/products/advancedminer/
22) Analitični reševalec
Analytic Solver lahko brezplačno uporablja orodje »pokaži in klikni«. Omogoča vam analizo tveganja in analitiko na recept v vašem brskalniku. Ponuja polna delovna mesta za podatkovno rudarjenje.
Lastnosti:
- Pomaga vam pri vključevanju negotovosti in reševanju s simulacijsko optimizacijo, stohastičnim programiranjem in robustno optimizacijo.
- Omogoča definiranje simulacijskega modela Monte Carlo z uporabo Excelovih formul
Povezava za prenos: https://analyticsolver.com/
23) PolyAnalyst
PolyAnalyst je orodje za podatkovno rudarjenje in analitično orodje za pridobivanje dejanskega znanja, skritega in dejansko strukturiranega.
Lastnosti:
- Pomaga vam pri dostopu do podatkov iz različnih virov in združevanju podatkov iz različnih virov
- Izbirate lahko med široko izbiro statističnih algoritmov in algoritmov strojnega učenja.
- Ponuja vam, da ustvarite poročilo o nadevu, ki ga lahko povzamete in posredujete svoj vpogled
Povezava za prenos: https://www.megaputer.com/polyanalyst/
24) Civis
Civis vas pooblašča za sprejemanje premišljenih odločitev z mislijo na podatkovnega znanstvenika in trg odločitev. Omogoča vaši ekipi učinkovito sodelovanje in hitrejše iskanje rešitev.
Lastnosti:
- Ponuja arhitekturo, izdelke in procese, ki vam pomagajo zaščititi svoje podatke
- Konfigurirate lahko s knjižnico zajemanja podatkov in modulov ETL.
- Napišite kodo v skriptu, v potek dela ponudite več skriptov ali opravil in določite potek dela, ki se bo izvajal po urniku.
- Omogoča, da analizo in modele spremenite v aplikacije, ki delujejo na prilagodljivi infrastrukturi na ravni proizvodnje
Povezava za prenos: https://www.civisanalytics.com/civis-platform/
25) Viscovery:
Viscovery je programska oprema, usmerjena v potek dela. Temelji na samoorganizirajočih se zemljevidih in multivariatnih statistikah za rudarjenje raziskovalnih podatkov in napovedno modeliranje. Sistem se odlikuje po intuitivnih navodilih za uporabnike in zreli izvedbi.
Lastnosti:
- Idealna platforma projektnega okolja za ciljno usmerjeno delovanje
- Namenski delovni tokovi, ki vam omogočajo osredotočeno navigacijo
- Jasni koraki poteka dela s preverjenimi privzetimi nastavitvami
- Razvejanje poteka dela omogoča generiranje različic modelov
- Funkcije za integrirano dokumentacijo in opombe
- Več orodij za lažjo uporabo
Povezava za prenos: https://www.viscovery.net/somine/