Өгөгдлийн маргаан нь богино хугацаанд илүү сайн ойлгох, шийдвэр гаргах, хандах, дүн шинжилгээ хийх зорилгоор Raw өгөгдлийг цуглуулах, цуглуулах, өөр формат болгон хувиргах үйл явц юм. Өгөгдлийн маргааныг мөн Data Munging гэж нэрлэдэг.
Өгөгдлийн маргаан гэж юу гэсэн үг вэ?
Өгөгдлийн маргаан нь хялбар хандах, дүн шинжилгээ хийх зорилгоор замбараагүй, төвөгтэй өгөгдлийн багцыг цэвэрлэж, нэгтгэхүйл явц юм. … Энэ процесс нь өгөгдлийг илүү тохиромжтой ашиглах, зохион байгуулах боломжийг олгох үүднээс нэг түүхий хэлбэрээс өөр формат руу гараар хөрвүүлэх, зураглах үйл ажиллагааг багтаадаг.
Python-д өгөгдлийн маргааныг юу жишээгээр тайлбарладаг вэ?
Өгөгдлийн маргаан нь өгөгдлийн шинжлэх ухааны ажлын урсгалын хамгийн чухал бүрэлдэхүүн хэсгүүдийн нэг юм. Энэ нь нэгтгэх, бүлэглэх, нэгтгэх гэх мэт гэх мэт янз бүрийн форматаар өгөгдлийг боловсруулахад хамаарна. тэдгээрийг өөр багц өгөгдөлд ашиглах эсвэл дүн шинжилгээ хийх зорилгоор.
Өгөгдлийн маргаан нь ямар үүрэгтэй вэ?
Өгөгдлийн маргааныг заримдаа өгөгдөл солилцох гэж нэрлэдэг өгөгдлийг нэг "түүхий" өгөгдлийн маягтаас өөр формат руу илүү тохиромжтой, үнэ цэнэтэй болгох зорилгоор хувиргах, зураглах үйл явц юманалитик гэх мэт төрөл бүрийн доод урсгалын зорилгоор.
Pandas-д өгөгдөл юугаараа маргаантай байдаг вэ?
Pandas нь нээлттэй эхийн номын сан бөгөөд өгөгдлийн шинжлэх ухаан, дүн шинжилгээ хийхэд зориулагдсан. Үүн дээр суурилдагNumpy (тоон өгөгдлийг хүснэгт хэлбэрээр боловсруулах) багц бөгөөд өгөгдөл солилцох/мөргөлдөөн гэх мэт өгөгдлийг боловсруулах үйл явцыг хөнгөвчлөх өгөгдлийн бүтэцтэй.