این مقاله ترجمه مقاله انگلیسی Parallel Clustering Algorithm for Large-Scale Biological
Data Sets می باشد . /
سال انتشار : 2014 /
تعداد صفحه مقاله انگلیسی : 9 /
تعداد صفحه ترجمه : 11/
فرمت فایل ترجمه : Word /
مقاله اصلی به زبان انگلیسی را می توانید رایگان از اینجا دریافت نمایید ./
ضمنا پیاده سازی این مقاله با نرم افزار CUDA در سایت جهت تهیه دوستان در اینجا موجود است . /
چکیده
پیش زمینه: گسترش انفجاری داده های زیست شناسی در سال های اخیر چالشی بزرگ برای الگوریتم های خوشه بندی سنتی بوجود آورده است. با افزایش مقیاس مجموعه داده ها، به حافظه های بزرگتر و زمان اجراهای طولانی تری برای مسایل شناسایی خوشه نیاز است. الگوریتم انتشار همریشگی (affinity propagation) عملکردی بهتر از بسیاری دیگر از الگوریتم های کلاسیک خوشه بندی دارد و بصورت گسترده در پژوهش های زیست شناسب بکار گرفته می شود. با این حال به هنگام پرداختن به مجموعه داده های دارای مقیاس بزرگ پیچیدگی زمانی و فضایی به تنگنا و محدودیت عمده ای تبدیل می شود. با این حال ماتریس شباهت که رویه های ساختن آن زمان اجرای زیادی می طلبد، پیش از اجرای الگوریتم انتشار همریشگی مورد نیاز است، چرا که این الگوریتم مجموعه داده ها را بر پایه ی مجموعه شباهت میان جفت داده ها خوشه بندی می کند.
ترجمه مقاله الگوریتم خوشه بندی موازی برای مجموعه داده های زیست شناسی مقیاس-بزرگ