برای دیدن دوره های ما کلیک کنید...

Cosine Similarity

Cosine Similarity

Cosine Similarity یا معیارهای شباهت:

معیارهای شباهت، در واقع معیارهایی مانند؛ معیارهای فاصله سنجی هستند که میزان دوری و یا نزدیکی داده ها را از هم محاسبه می نمایند. بدیهی است که معیار شباهت با معیارهای فاصله رابطه عکس دارند و به عبارتی هر چه میزان شباهت بیشتر باشد می‌توان نتیجه گرفت فاصله‌ی دو شئ کمتر خواهد بود.

Cosine Similarity :

شباهت کسینوسی یک متریک است که برای تعیین اینکه اسناد صرف نظر از اندازه آن ها چقدر مشابه هستند استفاده می شود. از نظر ریاضی شباهت کسینوسی، کسینوس زاویه بین دو بردار پیش بینی شده در یک فضای چند بعدی را اندازه گیری می کند.

 

 هنگامی که بر روی یک فضای چند بعدی رسم می شود، جایی که هر بعد با یک کلمه در سند مطابقت دارد، شباهت کسینوسی جهت گیری (زاویه) اسناد را اندازه گیری می کند و نه بزرگی. اگر بزرگی را می خواهید، به جای آن فاصله Euclidean را محاسبه کنید.

شباهت کسینوسی همیشه متعلق به بازه  [-1,1] به عنوان مثال، دو بردار متناسب دارای شباهت کسینوسی ۱، دو بردار متوژنال شباهت ۰ و دو بردار مخالف شباهت ۱- دارند. این تکنیک همچنین برای اندازه گیری انسجام درون خوشه ها در زمینه داده کاوی استفاده می شود. یکی از مزیت های شباهت کسینوسی پیچیدگی پایین آن است، به ویژه برای بردارهای کم رنگ: تنها مختصات غیر صفر باید در نظر گرفته شوند.

برای مثال در معماری:

ابتدا چندین پلان معماری را گردآوری می کنیم و سپس نویزی گیری کرده و در ادامه پیکسل های پلان ها را  یکی یکی از طریق پردازش تصویر تبدیل به بردارهای عددی می نماییم و سپس این بردارها را در مختصات دکارتی ترسیم و با فرمول محاسبه زاویه کسینوس، زاویه آن ها را برآورد می کنیم و درصدهای تولید شده را به ماتریس تبدیل می کنیم و متوجه می شویم که این پلان ها از نظر شکلی چه میزان باهم شباهت دارند و یا در از یک الگو معماری پیروی نموده اند.

 

ارسال دیدگاه

نشانی ایمیل شما منتشر نخواهد شد.