تجزیه و تحلیل داده (Data Analytics) و چگونگی انجام آن
روند تجزیه و تحلیل دادهها در طول زمان
در اینجا اشاره کردیم که تجزیه و تحلیل دادهها، به موضوعی بزرگ برای شرکتهای بزرگ و استارتاپهای کوچک تبدیلشده است. همچنین در طول زمان، فرایند تجزیه و تحلیل دادهها بهبود یافته است. در این بخش، قصد داریم بهطور مختصر به تاریخچه تحول تجزیه و تحلیل دادهها بپردازیم.
تجزیه و تحلیل دادهها و آمار
اندازهگیری آمارها تاریخچه بسیار طولانی دارد. به عنوان مثال، بررسی مالیات توسط دولتها یا برنامههای برنامهریزی برای ایجاد سرشماری که با استفاده از آمار امکانپذیر بوده است. تجزیه و تحلیل دادهها، از آماری نشأت میگرفت که دادههای بهدست آمده را تجزیه و تحلیل میکرد.
تجزیه و تحلیل و محاسبه دادهها
فناوری نحوه استفاده از تجزیه و تحلیل داده در هر کسب و کار را تغییر میدهد. در سال ۱۸۹۰، هرمان هولریت «ماشین جدولبندی» را ابداع کرد تا زمان مورد نیاز برای انجام وقایع آماری را کاهش دهد. این دستگاه در انتهای سال ۱۸۹۰ تنها در ۱۸ ماه برای ایالات متحده بسیار مفید بود.
داده کاوی
داده کاوی در دهه ۱۹۹۰ آغاز شد و این فرآیند مهم به منظور کشف الگوهای ضروری در مجموعههای بزرگ داده استفاده میشود. با استفاده از این روش، وقتی که تحلیل دادهها از چارچوبهای قدیمی به شیوههای مدرنتر منتقل میشود، میتوانید نتایج بهتری کسب کنید.
جستجوی گوگل
هنگامی که گوگل به دنیا فناوری وارد شد، دادههای بزرگ به سرعت تجزیه، تحلیل و پردازش شدند. این موضوع نقش اساسی در تکامل تجزیه و تحلیل دادهها داشت، زیرا موتور جستجویی خودکارتر، مقیاس پذیرتر و با عملکرد بهتری بود.
پردازش دادهها
امروزه زبانهای برنامهنویسی مانند پایتون و R، به عنوان فناوریهای پیشرو در تجزیه و تحلیل دادهها شناخته میشوند. این زبانها منبع باز هستند و قابلیت ادغام با سیستمهای کلان داده و ابزارهای تجسم داده را دارند. هنگامی که هدف اصلی یک کسب و کار تجزیه و تحلیل اکتشافی یا مدلسازی است، زبان R ترجیح داده میشود. به علاوه، شرکتها تمایل دارند با استفاده از زبان پایتون، برنامههایی با مقادیر تحلیلی توسعه دهند.
مدلسازی پیشبینی
تکنیکهای پیشرفته برخی روشهای استفاده شده توسط دانشمندان و سازمانها برای تجزیه و تحلیل دادهها شامل الگوریتم جنگل تصادفی، فاکتورسازی ماتریس، تنسورفلو، Simulated Annealing و دیگر روشها است.
تجسم (Visualization)
بسیاری از سازمانها جهت تحقق اهداف کسب و کار خود، به دنبال فناوریهای منبع باز بیشتری هستند، مثلD۳ و Angular. این تصمیم به دلایل متعددی از جمله هزینه، امکانات سفارشیسازی، جذابیت ظاهری و ارتباط برپایه تعامل برمیگردد.