fbpx

Өгөгдөл нь Machine Learning салбарт чухал бүрэлдэхүүн хэсэг юм. Энэ нь машин сургалтын загварыг сургахад ашиглаж болох ажиглалт эсвэл хэмжилтийн багцыг хэлнэ. Сургалт, туршилтад ашиглах өгөгдлийн чанар, тоо хэмжээ нь машин сургалтын загварын гүйцэтгэлийг тодорхойлоход чухал үүрэг гүйцэтгэдэг. Өгөгдөл нь тоон, ангилсан эсвэл цуваа өгөгдөл гэх мэт янз бүрийн хэлбэртэй байж болох ба өгөгдлийн сан, хүснэгт, API гэх мэт янз бүрийн эх сурвалжаас ирж болно. Машин сургалтын алгоритмууд нь оролтын хувьсагч ба зорилтот гаралтын хоорондын хамаарлыг судлахын тулд өгөгдлийг ашигладаг бөгөөд үүнийг урьдчилан таамаглах эсвэл ангилах ажилд ашиглаж болно.

Мөн та бүхэнд их өгөгдлийн тухай нийтлэлийг санал болгож байна. Энд дарна уу.

Өгөгдлийг ихэвчлэн 2 төрөлд хуваана.

  1. Бүтэцтэй дата
  2. Бүтэцлэгдээгүй дата

Бүтэцтэй дата загвар нь урьдчилан таамаглах гэж буй өгөгдөл эсвэл зорилтот хувьсагчийг агуулдаг бол Бүтэцлэгдээгүй дата бүтэц эсвэл зорилтот хувьсагч агуулаагүй болно. Тоон өгөгдөлд нас, орлого гэх мэт захиалж, хэмжиж болох утгуудыг багтаасан болно. Ангилал өгөгдөлд хүйс, жимсний төрөл зэрэг категориудыг төлөөлөх утгууд багтана.

ӨГӨГДӨЛ: Энэ нь ямар ч боловсруулагдаагүй баримт, үнэ цэнэ, текст, дуу авиа, зураглалыг тайлбарлаж, шинжлэхгүй байж болно. Өгөгдөл нь бүх мэдээллийн аналитик, машин сургалт, хиймэл оюун ухааны хамгийн чухал хэсэг юм. Өгөгдөлгүйгээр бид ямар ч загварыг сургаж чадахгүй бөгөөд орчин үеийн бүх судалгаа, автоматжуулалт дэмий хоосон болно. Том аж ахуйн нэгжүүд аль болох тодорхой мэдээлэл цуглуулахын тулд маш их мөнгө зарцуулж байна.

Жишээ: Facebook яагаад 19 тэрбум долларын асар их үнэ төлж WhatsApp-ийг авсан бэ? Хариулт нь маш энгийн бөгөөд логиктой – энэ нь Facebook-т байхгүй ч WhatsApp-д байх хэрэглэгчдийн мэдээлэлд хандах явдал юм. Хэрэглэгчдийн энэхүү мэдээлэл нь Facebook-ийн хувьд нэн чухал бөгөөд энэ нь тэдний үйлчилгээг сайжруулах ажлыг хөнгөвчлөх болно.

what is data?

Нийтлэл бичсэн: Б. Сайнбаяр

Leave a Reply