فصلنامه تخصصی فناوری اطلاعات و ارتباطات

نوع مقاله : مقاله پژوهشی

نویسنده

گروه مهندسی کامپیوتر، واحد علوم و تحقیقات، دانشگاه آزاد اسلامی، آذربایجان غربی، ایران

چکیده

ظهور علم داده‌ کاوی باعث شده است که داده‌ها به یکی از سرمایه‌های بسیار ارزشمند سازمان‌ها تبدیل شوند و استفاده درست از این برگ برنده، سیستم های نرم افزاری بتوانند نتایج را به نحو متفاوت و موثری رقم بزنند. به فرایند استخراج و کشف الگوها و همبستگی‌ها از میان حجم زیادی از داده‌های خام از یک یا چند بانک اطلاعاتی، داده کاوی می‌گویند. داده کاوی بخش مهم و اساسی در تجزیه و تحلیل اطلاعات توزیعی سازمان های امروزی است. داده های بدست آمده از داده کاوی را می توان در هوش تجاری و تجزیه و تحلیل پیشرفته استفاده کرد . افزایش ظرفیت، یافتن الگوها، روندها و همبستگی های پنهان در مجموعه داده ها، یکی از اصلی ترین مزیت های ابزارهای داده کاوی است. با توجه به تکامل فناوری ذخیره‌سازی داده‌ها و رشد کلان داده‌ها، استفاده از تکنیک‌های داده‌کاوی طی دو دهه اخیر به طور چشم‌گیری افزایش یافته است. بهره گیری از ابزارهای برتر داده کاوی با مشخص کردن روابط و الگوهای پنهان در داده ها به کسب و کارها در تصمیم گیری و اجرای کارآمدتر فرایندهای دانش محور کمک می کنند. علی رغم این که این فناوری برای رسیدگی به داده‌ها در مقیاس بزرگ به طور مداوم تکامل می‌یابد، رهبران هنوز در مورد مقیاس‌پذیری و اتوماسیون با چالش‌هایی روبرو هستند. بنا به اهمیت موضوع در این مقاله قصد داریم به بررسی کاربردهای داده کاوی، نیازمندی ها، فرایند و ابزارهای مهم این حوزه بپردازیم. در پایان نیز درخصوص دورنمای تکنولوژیکی داده کاوی بررسی می نمائیم.

کلیدواژه‌ها

عنوان مقاله [English]

Data Mining, Applications, Requirements, Process and Tools

نویسنده [English]

  • Payam Mohammadi

Department of Computer Engineering, Science and Research Branch, Islamic Azad University, West Azerbaijan, Iran

چکیده [English]

The emergence of data mining science has made data become one of the most valuable assets of organizations and with the correct use of this trump card, software systems can produce results in a different and effective way. The process of extracting and discovering patterns and correlations from a large volume of raw data from one or more databases is called data mining. Data mining is an important and fundamental part in the analysis of distributed information of today's organizations. The data obtained from data mining can be used in business intelligence and advanced analysis. Increasing capacity, finding hidden patterns, trends and correlations in data sets is one of the main advantages of data mining tools. Due to the evolution of data storage technology and the growth of big data, the use of data mining techniques has increased dramatically in the last two decades. Using the best data mining tools helps businesses to make decisions and implement knowledge-based processes more efficiently by identifying hidden relationships and patterns in the data. Despite the technology constantly evolving to handle large-scale data, leaders still face challenges around scalability and automation. According to the importance of the topic in this article, we are going to examine the applications of data mining, requirements, process and important tools in this field. In the end, we will examine the technological perspective of data mining.

کلیدواژه‌ها [English]

  • Data mining
  • Analysis and modeling
  • distribution base
[1] Gupta MK, Chandra P. A comprehensive survey of data mining. International Journal of Information Technology. 2020 Dec;12(4):1243-57.
[2] Oweis NE, Owais SS, George W, Suliman MG, Snášel V. A survey on big data, mining:(tools, techniques, applications and notable uses). InIntelligent Data Analysis and Applications: Proceedings of the Second Euro-China Conference on Intelligent Data Analysis and Applications, ECC 2015 2015 (pp. 109-119). Springer International Publishing.
[3] Roy U, Zhu B, Li Y, Zhang H, Yaman O. Mining big data in manufacturing: requirement analysis, tools and techniques. InASME International Mechanical Engineering Congress and Exposition 2014 Nov 14 (Vol. 46606, p. V011T14A047). American Society of Mechanical Engineers.
[4] Mughal MJ. Data mining: Web data mining techniques, tools and algorithms: An overview. International Journal of Advanced Computer Science and Applications. 2018;9(6).
[5] Padhy N, Mishra DP, Panigrahi R. The survey of data mining applications and feature scope. arXiv preprint arXiv:1211.5723. 2012 Nov 25.
[6] Mariscal G, Marban O, Fernandez C. A survey of data mining and knowledge discovery process models and methodologies. The Knowledge Engineering Review. 2010 Jun;25(2):137-66.
[7] Bartschat A, Reischl M, Mikut R. Data mining tools. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery. 2019 Jul;9(4):e1309.
[8] Vikram K, Siddipet MD, Upadhayaya N. Data mining tools and techniques: a review. Logistics management. 2011;2(8).
[9] Goebel M, Gruenwald L. A survey of data mining and knowledge discovery software tools. ACM SIGKDD explorations newsletter. 1999 Jun 1;1(1):20-33.
[10] Prakash BA, Ashoka DV, Aradhya VM. Application of data mining techniques for software reuse process. Procedia Technology. 2012 Jan 1;4:384-9.
[11] Halkidi M, Spinellis D, Tsatsaronis G, Vazirgiannis M. Data mining in software engineering. Intelligent Data Analysis. 2011 Jan 1;15(3):413-41.
[12] Rohanizadeh SS, BAMENI MM. A proposed data mining methodology and its application to industrial procedures.
[13] Gonzalez R, Kamrani A. A survey of methodologies and techniques for data mining and intelligent data discovery. InData Mining for Design and Manufacturing: Methods and Applications 2001 Oct 31 (pp. 41-59). Boston, MA: Springer US.
[14] Jackson J. Data mining; a conceptual overview. Communications of the Association for Information Systems. 2002;8(1):19.
[15] Madni HA, Anwar Z, Shah MA. Data mining techniques and applications—A decade review. In2017 23rd international conference on automation and computing (ICAC) 2017 Sep 7 (pp. 1-7). IEEE.
[16] PhridviRaj MS, GuruRao CV. Data mining–past, present and future–a typical survey on data streams. Procedia Technology. 2014 Jan 1;12:255-63.
[17] Turner CJ, Tiwari A, Olaiya R, Xu Y. Process mining: from theory to practice. Business Process Management Journal. 2012 Jun 1;18(3):493-512.
[18] Santos-Pereira J, Gruenwald L, Bernardino J. Top data mining tools for the healthcare industry. Journal of King Saud University-Computer and Information Sciences. 2022 Sep 1;34(8):4968-82.
[19] Al-Odan HA, Al-Daraiseh AA. Open source data mining tools. In2015 International Conference on Electrical and Information Technologies (ICEIT) 2015 Mar 25 (pp. 369-374). IEEE.
[20] Malkawi R, Saifan AA, Alhendawi N, BaniIsmaeel A. Data mining tools evaluation based on their quality attributes. International Journal of Advanced Science and Technology. 2020 Mar;29(3):13867-90.
[21] Kadaru BB, UmaMaheswararao M. An overview of general data mining tools. Int Res J Eng Technol. 2017 Sep;4(9):930-6.
[22] Mikut R, Reischl M. Data mining tools. Wiley interdisciplinary reviews: data mining and knowledge discovery. 2011 Sep;1(5):431-43.
[23] Wendler T, Gröttrup S. Data mining with SPSS modeler: theory, exercises and solutions. Springer; 2016 Jun 6.