ପରିସଂଖ୍ୟାନ ବର୍ଗୀକରଣ

ଉଇକିପିଡ଼ିଆ ରୁ
Jump to navigation Jump to search

ପରିସଂଖ୍ୟାନ ବର୍ଗୀକରଣ ବା କ୍ଲାସିଫିକେସନ (ଇଂରାଜୀ: Statistical classification) କହିଲେ ମେସିନ ଲର୍ଣ୍ଣିଙ୍ଗ ବା ପରିସଂଖ୍ୟାନରେ କିଛି ଜଣାଶୁଣା ବର୍ଗିତ ତଥ୍ୟକୁ ଭିତ୍ତି କରି କିଛି ଅଜଣା ତଥ୍ୟକୁ ବର୍ଗୀକରଣ କରିବାକୁ ବୁଝାଇଥାଏ । କିଛି ବର୍ଗୀକରଣ ସମସ୍ୟାର ଉଦାହରଣ ନିମ୍ନରେ ଦିଆଗଲା ।

  • ଇ-ମେଲଗୁଡ଼ିକୁ ନେଇ ସେଥିରୁ ଭଲ ଏବଂ ଖରାପ ଇ-ମେଲ ବାହାର କରିବା ।
  • ମନୁଷ୍ୟମାନଙ୍କର ଏକ ଜିନିଷ ଉପରେ ମତାମତନେଇ ସେଥିରୁ ଭାବ ଉଦ୍ଧାରଣ କରିବା, ଯେପରିକି ଭଲ, ଅତି ଭଲ, ଚଳିବ, ଖରାପ ଏବଂ ଅତି ଖରାପ । ଏହାକୁ ସେଣ୍ଟିମେଣ୍ଟ୍ ଆନାଲିସିସ କୁହାଯାଇଥାଏ ।
  • ପୁଞ୍ଜି ବଜାରରେ କୌଣସି ଏକ ସେୟାରର ମୂଲ୍ୟ ବଢିବ ବା କମିବ ।

ବର୍ଗୀକରଣ ହେଉଛି ଢାଞ୍ଚା ଚିନ୍ହିବାର (ଇଂରାଜୀ: Pattern Recognition) ଏକ ଉଦାହରଣ ।

ମେସିନ ଲର୍ଣ୍ଣିଙ୍ଗ ହିସାବରେ ବର୍ଗୀକରଣ ହେଉଛି ସୁପରଭାଇଜଡ ଲର୍ଣ୍ଣିଙ୍ଗର ଏକ ବିଭାଗ ।[୧] ଯେଉଁଠାରେ ଏକ ପୂର୍ବନିର୍ଦ୍ଧାରିତ ଚିନ୍ହିତ ତଥ୍ୟ ଆଗରୁ ଉପଲବ୍ଧ ଥାଏ । ଏହାର ସମକକ୍ଷ ଅନସୁପରଭାଇଜଡ ଲର୍ଣିଂରେ କ୍ଲଷ୍ଟରିଂ କୁହାଯାଏ, ଯେଉଁଠାରେ ଚିନ୍ହିତ ତଥ୍ୟ ପୂର୍ବରୁ ଉପଲବ୍ଧ ନଥାଏ । ଏଠାରେ ତଥ୍ୟଗୁଡ଼ିକ ମଧ୍ୟରେ ଥିବା ଦୂରତା ଏବଂ ସମାନତା ହିସାବରେ ବର୍ଗୀକରଣ ହୋଇଥାଏ ।

ଆଲଗୋରିଦମ ଗୁଡ଼ିକ[ସମ୍ପାଦନା]

ଉଭୟ ସୁପରଭାଇଜଡ ଏବଂ ଅନସୁପରଭାଇଜଡ ଲର୍ଣ୍ଣିଙ୍ଗରେ ବର୍ଗୀକରଣ କିଛି ନିର୍ଦ୍ଧିଷ୍ଟ ନିୟମଦ୍ୱାରା ସମ୍ପାଦିତ ହୋଇଥାଏ । ଯେହେତୁ ଗୋଟିଏ ଆଲଗୋରିଦମ ବା ନିୟମରେ ସବୁ ସମସ୍ୟାଗୁଡ଼ିକର ସମାଧାନ ଅସମ୍ଭବ ଅଟେ, ତେଣୁ ଭିନ୍ନ ଭିନ୍ନ ଆଲଗୋରିଦମ ତିଆରି ହୋଇଛି ।[୨]

କିଛି ଜଣାଶୁଣା ଆଲଗୋରିଦମକୁ ନିମ୍ନରେ ଦର୍ଶାଯାଇଛି । [୩]

ଆହୁରି ଦେଖନ୍ତୁ[ସମ୍ପାଦନା]

ଆଧାର[ସମ୍ପାଦନା]

  1. Alpaydin, Ethem (2010). Introduction to Machine Learning. MIT Press. p. 9. ISBN 978-0-262-01243-0.
  2. "What is a Classifier in Machine Learning?".
  3. "A Tour of The Top 10 Algorithms for Machine Learning Newbies". Towards Data Science. 2018-01-20. Retrieved 2018-10-10.