Data Mining

Mikä on tiedonlouhinta:

Tietojen louhinta on englanninkielinen termi, joka liittyy tietojenkäsittelytieteen, jonka kääntäminen on tiedonlouhinta . Se koostuu toiminnallisuudesta, joka kokoaa ja järjestää tietoja, löytää niistä merkityksellisiä malleja, yhdistyksiä, muutoksia ja poikkeavuuksia .

Tietojen kaivostoiminta ilmaistiin ensimmäisen kerran vuonna 1990 tietokantayhteisöissä. Tietojen louhinta on prosessianalyysi, joka tunnetaan nimellä KDD ( Tietokantojen tietämyksen etsintä), jonka kirjaimellinen käännös on "Tietojen löytäminen tietokannoissa".

Tietojen louhinta voidaan jakaa muutamiin perusvaiheisiin: etsintään, mallin rakentamiseen, kuvion määrittelyyn ja validointiin ja varmistamiseen.

Tietojen louhinta on suhteellisen uusi käytäntö tietojenkäsittelyn maailmassa, ja se käyttää tiedonhakua, keinotekoista älyä, kuvion tunnistamista ja tilastollisia tekniikoita etsimään korrelaatioita eri tietojen välillä, joiden avulla voit saada hyödyllistä tietoa yritykselle tai henkilölle. Yritykselle kaivostoiminta voi olla tärkeä väline, joka parantaa innovointia ja kannattavuutta.

Tietojen louhinnan käyttö on melko yleistä suurissa tietokannoissa, ja niiden käytön lopputulos voidaan näyttää sääntöjen, hypoteesien, päätöspuiden, dendrogrammien jne. Kautta.

Hyvin toteutetulla datan louhinnalla olisi suoritettava seuraavat tehtävät: poikkeaman havaitseminen, yhdistyssääntöjen oppiminen (riippuvuuden mallinnus), klusterointi, luokittelu, regressio ja yhteenveto. Tietojen louhinta tapahtuu tyypillisesti tietovaraston sisältämien tietojen avulla .

Tietojen louhintaan on omistettu useita yrityksiä ja ohjelmistoja, sillä tietokantojen mallien tunnistaminen on yhä tärkeämpää. Asiaankuuluvien standardien tunnistaminen ei kuitenkaan ole ainutlaatuinen tietokoneen maailmassa. Ihmisen aivot käyttävät samanlaista prosessia tunnisteiden tunnistamiseksi ja tiedon saamiseksi.

Viime vuosina tietojenkäsittelyä on käytetty laajalti tieteen ja tekniikan aloilla, kuten bioinformatiikassa, genetiikassa, lääketieteessä, koulutuksessa ja sähkötekniikassa.

Tietojen louhinnan käsite liittyy usein ihmisten käyttäytymiseen liittyviin tietoihin. Tästä syystä tietyissä tilanteissa tietojenkäsittely herättää oikeudellisia kysymyksiä ja kysymyksiä, jotka liittyvät yksityisyyteen ja etiikkaan. Tästä huolimatta monet ihmiset väittävät, että tietojenkäsittely on eettisesti neutraali, koska sillä ei ole eettisiä vaikutuksia.

Real Data Mining -esimerkkejä

Yritykset ja organisaatiot käyttävät usein tiedonhankintaa tietämyksen saamiseksi käyttäjistä / työntekijöistä / asiakkaista. Esimerkiksi julkisella sektorilla on mahdollista tarkistaa työntekijän siviilisääty ja palkka, jonka hän ansaitsee, jotta voidaan selvittää, onko sillä vaikutusta hänen avioliittoonsa.

Yritykset, kuten supermarketketjut, voivat käyttää tätä ristiintietoa yhdessä ostettujen tuotteiden määrittämiseen. Jos tuote X ostaa myös Y: n, voi olla hyvä idea sijoittaa nämä kaksi tuotetta lähemmäksi, jotta asiakkaan on helpompi ostaa.