fbpx

Их өгөгдлийг тодорхойлох нь:

Их өгөгдөл гэдэг нь үндсэндээ өгөгдөл боловсруулах уламжлалт программ хангамжаар ажиллахад хэтэрхий том эсвэл төвөгтэй өгөгдлийн багцыг хэлдэг. Олон оруулга бүхий өгөгдөл нь илүү их статистик хүчийг санал болгодог бол илүү нарийн төвөгтэй өгөгдөл (илүү олон шинж чанар эсвэл багана) нь хуурамч нээлтийн хурдыг нэмэгдүүлэхэд хүргэдэг. Хэдийгээр албан ёсны тодорхойлолт дутмаг учраас зарим талаараа хэсэгчлэн ашигладаг ч том өгөгдлийг хамгийн сайн тайлбарлаж байгаа тайлбар нь зөвхөн бага хэмжээгээр ашиглахад бидний ойлгох боломжгүй их хэмжээний мэдээлэлтэй холбоотой тайлбар юм.

Том өгөгдлийн шинжилгээний сорилтууд: Өгөгдөл цуглуулах, өгөгдөл хадгалах, өгөгдөлд дүн шинжилгээ хийх, хайх, хуваалцах, дамжуулах, дүрслэх, асуулга хийх, шинэчлэх, мэдээллийн нууцлал, мэдээллийн эх сурвалж зэрэг орно. Big data нь анх эзлэхүүн, төрөл зүйл, хурд гэсэн гурван үндсэн ойлголттой холбоотой байсан. Том өгөгдлийн шинжилгээ нь түүвэрлэлтэд бэрхшээлтэй тулгардаг тул урьд нь зөвхөн ажиглалт, түүвэрлэлт хийх боломжийг олгодог. Тиймээс дөрөв дэх үзэл баримтлал болох үнэн зөв байдал нь мэдээллийн чанар эсвэл ухаалаг байдлыг илэрхийлдэг. Том өгөгдлийн үнэн зөв байдлын талаархи мэдлэгт хангалттай хөрөнгө оруулалт хийхгүй бол өгөгдлийн хэмжээ, олон янз байдал нь том өгөгдлөөс үнэ цэнийг бий болгох, олж авах байгууллагын чадавхиас давсан зардал, эрсдэлийг үүсгэж болзошгүй юм.

Их өгөгдлийн 3 Vs

  1. Volume: Өгөгдлийн хэмжээ чухал. Их өгөгдлийн тусламжтайгаар та бага нягтралтай, бүтэцгүй их хэмжээний өгөгдлийг боловсруулах хэрэгтэй болно. Энэ нь вэб хуудас эсвэл мобайл програм дээрх товшилтууд, мэдрэгчтэй төхөөрөмж гэх мэт үл мэдэгдэх үнэ цэнэтэй өгөгдөл байж болно. Зарим байгууллагын хувьд энэ нь хэдэн арван терабайт өгөгдөл байж болно. Бусад хүмүүсийн хувьд энэ нь хэдэн зуун петабайт байж болно.
  2. Velocity: Хурд гэдэг нь өгөгдлийг хүлээн авах, (магадгүй) үйлдэл хийх хурд юм. Ер нь өгөгдлийн урсгалын хамгийн өндөр хурд нь диск рүү бичигдэхээс шууд санах ой руу ордог. Интернетэд холбогдсон зарим ухаалаг бүтээгдэхүүн нь бодит цаг хугацаанд эсвэл бодит цаг хугацаанд ажилладаг бөгөөд бодит цагийн үнэлгээ, арга хэмжээ авах шаардлагатай болно.
  3. Variety: Янз бүрийн байдал гэдэг нь олон төрлийн өгөгдөлд байдаг. Уламжлалт өгөгдлийн төрлүүд нь бүтэц зохион байгуулалттай, харилцааны мэдээллийн санд бүрэн нийцсэн байв. Том өгөгдлийн өсөлтөөр өгөгдөл нь шинэ бүтэцгүй өгөгдлийн төрлөөр гарч ирдэг. Текст, аудио, видео зэрэг бүтэцгүй болон хагас бүтэцтэй өгөгдлийн төрлүүд нь утгыг гаргаж авах, мета өгөгдлийг дэмжихийн тулд нэмэлт урьдчилсан боловсруулалт шаарддаг.
3 Vs of Big Data

Биг дата гэсэн нэр томъёог 1990-ээд оноос хойш хэрэглэж ирсэн бөгөөд зарим нь энэ нэр томъёог дэлгэрүүлсэн Жон Машейг алдаршуулсан байна. Том өгөгдлүүд нь ихэвчлэн хүлээн зөвшөөрөгдсөн хугацааны дотор өгөгдлийг цуглуулах, удирдах, удирдах, боловсруулах өргөн хэрэглэгддэг програм хангамжийн хэрэгслээс хэтэрсэн хэмжээтэй өгөгдлийн багцуудыг агуулдаг. Том өгөгдлийн философи нь бүтэцгүй, хагас бүтэцтэй, бүтэцлэгдсэн өгөгдлийг агуулдаг; гэхдээ бүтэцгүй өгөгдөлд гол анхаарлаа хандуулдаг. Их өгөгдлийн хэмжээ нь байнга ихэсдэг 2012 оны байдлаар хэдэн арван терабайтаас олон zettabyte өгөгдөл хүртэл. Том өгөгдөл нь олон янзын, нарийн төвөгтэй, асар том хэмжээний өгөгдлийн багцаас ойлголтыг илчлэхийн тулд интеграцийн шинэ хэлбэр бүхий олон техник, технологийг шаарддаг.

Size of Big Data

Китчин, МакАрдл нар том өгөгдлийн багцын харьцуулсан судалгаагаар их өгөгдлийн нийтлэг гэж үздэг шинж чанаруудын аль нь ч дүн шинжилгээ хийсэн бүх тохиолдлуудад тогтмол байдаггүй болохыг тогтоожээ. Энэ шалтгааны улмаас бусад судалгаанууд мэдлэгийн нээлт дэх хүч чадлын динамикийг дахин тодорхойлохыг тодорхойлох шинж чанар гэж тодорхойлсон. Их өгөгдлийн дотоод шинж чанарт анхаарлаа хандуулахын оронд энэхүү өөр хэтийн төлөв нь өгөгдөл цуглуулах, хадгалах, ашиглах боломжтой болгох, дүн шинжилгээ хийх арга зам нь чухал гэж үздэг объектын талаархи харилцааны ойлголтыг урагшлуулдаг.

Нийтлэл бичсэн: Б. Сайнбаяр

Leave a Reply