جزوه درس داده های حجیم با دکتر اسماعیلی
در دنیای امروز، در کسری از ثانیه تعداد نامحدودی data تولید میشود.
در تصویر زیر برای تعدادی از شرکتهای معروف نشان میدهد که در هر 60ثانیه، چه مقدار داده تولید میشود. البته این میزان داده همچنان در حال افزایش است.
برای مثال:
هر 60 ثانیه در Google نزدیک به 700هزار جستجو انجام میشود.(حدودا ثانیهای 10هزارتا)
در 60 ثانیه در Skype ،370هزار دقیقه صدا ثبت میشود.
این داده ها جزو ارزشمندترین دادهها میباشند، چرا که با استفاده از داده کاوی میتوان نتایج ارزشمندی از آنها استخراج کرد.
در جایی عنوان شده که گوگل به دلیل تحلیل تعداد جستجوهایی که انجام میشود، سریعتر از پزشکان یک منطقه متوجه میشود که در آن منطقه چه بیماریای رایج شده است. مثال از منطقهی X مدام جستجو میشود: "داروی سرماخوردگی؟" پس گوگل متوجه می شود در آنجا سرماخوردگی رایج شده است.