Uzdevuma veidošanai un risināšanai tika izmantoti dati tika ņemti no reklāmas firmas(firmas dati ir izdomāti, lai varētu veikt nepieciešamo uzdevuma apstrādi.), kas nodarbojas ar dažādu preču reklamēšanu. – tie paši ieraksti, kuri tika pielietoti 1. darbā pielietojot Naiva Baijesa algoritmu.
Apmācības datu kopa sastāv no 25 ierakstiem, tos raksturo 5 atribūti – pieņemšanas gads, dzimums, bērnu skaits ģimenē, dzīvesvieta un darbinieka fiziskā stāja. Pielietojot programmu See5.0, tabulai tika pievienoti vēl divi atribūti – svars un augums, jo programma var strādāt arī ar nepārtrauktiem datiem. Un kā klases tika izvēlēts fakts vai darbinieks ir mēneša laikā slimojis vai ne.
Darba daļas:
ID3
Realizācijas posmu aprēķinu veidošana un attēlošana
Datu sadalēs pēc katras koka izveidošanas iterācijas attēlošana
Gala koka attēlošana
Kļūdas (ja ir) uz apmācības novērtēšana
Jauno piemēru klasifikācija un kļūdas (ja ir ar ko salīdzināt) novērtēšana
C5.0
Koka izveidošana ar programmas palīdzību
Gala koka attēlošana
Kļūdas (ja ir) uz apmācības novērtēšana
Jauno piemēru klasifikācija un kļūdas (ja ir ar ko salīdzināt) novērtēšana
Failu *.data un *.names sagatavošana rādīšanai pasniedzējam.
Induktīvais lēmumu koks patiesībā ir grafs ar vairākām virsotnēm, kuras savā starpā ir saistītas ar lokiem. Katra grafa iekšējā virsotne atspoguļo kādu ne-mērķa atribūtu un katrs loks – iespējamo šī atribūta vērtību. Savukārt koka lapas (mērķa virsotnes) atspoguļo mērķa atribūta gaidīto vērtību vai arī klasi. Sākuma virsotni kokā sauc par saknes virsotni.
Lai klasificētu nezināmu objektu, tā atribūta vērtības ir jāpārbauda uz lēmumu koka. Rezultātā rodas ceļš, kas ved no saknes virsotnes uz koka lapu. Tas satur klases paredzējumu.
Informācijas labuma mērs tiek lietots, lai varētu izvēlēties pārbaudes atribūtu katrā koka virsotnē. Tāds mērs ir saprotams kā atribūta izvēles mērs vai sadalīšanās labuma novērtējuma mērs. Atribūts ar visaugstāko informācijas labumu (vai lielāko entropijas samazināšanos) tiek izvēlēts kā pārbaudes atribūts tekošai virsotnei. Šis atribūts minimizē informāciju vajadzīgu, lai klasificētu eksemplārus rezultējošos nodalījumos un atspoguļo nejaušību vai „neskaidrību” šajos nodalījumos.…