همانطور که قبلا اشاره شد، “تراکم کلمه کلیدی” به عنوان یک فاکتور جدا شده ، ارتباط خود را از دست داده است. در سال های اخیر، با این حال، تاثیر فرمول موسوم به WDF * P * IDF ، اغلب مورد بحث بوده است. که اصل تشابه یک کوئری (Query ) به محتویات صفحه را شرح می دهد.

این رویکرد ، بر روی همبستگی دو فاکتور ، یعنی ” تعداد نمونه های یک کلمه کلیدی در یک سند ، در ارتباط با همه موارد دیگر ” ، تعداد تکرار درون سند یا within-document-frequency (=WDF ) و ” تعداد نمونه های یک کلمه کلیدی در همه اسناد مربوطه در پایگاه داده های اصلی و زیربنایی ” ، تعداد تکرار معکوس در سند یا inverse-document-frequency (=IDF) ، ( در این مورد : شاخص گوگل)۶ تمرکز دارد.

به طور خلاصه: ارتباط یک واژه به یک سند، و در مرحله دوم، ارتباط یک واژه به یک کوئری (Query) جستجو با استفاده از کلمات کلیدی، باید، با توجه به این رویکرد، با این اصطلاح / کلمه کلیدی در شاخص نه تنها در رابطه با وب سایت های فردی بلکه مهم تر از آن در رابطه با تمام وب سایت های دیگر وزن داده شود.

همبستگی برای این فاکتور نیز ، با استفاده از استخر داده های ما در مورد ۳۰ رتبه ی بالا ، محاسبه شده بود. در این مورد تنها ، محتوای وب سایت برای محاسبه در نظر گرفته شده است. در محور y از جدول زیر، شباهت متوسط ​​ کلمات کلیدی مرتبط با سند در رتبه بندی نتایج جستجوی خاص ، در مقیاس از ۰ = “حداقل مشابه” تا ۱ = “یکسان است” ، ارائه شده است.