Arama Motoru Optimizasyonu

TF – IDF Nedir? Bilmeniz Gereken Her Şey

TF – IDF Nedir? Bilmeniz Gereken Her Şey

TF-IDF (Term Frequency-Inverse Document Frequency) kavramı, belirli bir anahtar kelimenin içerik içerisindeki tekrarlanma sıklığını matematiksel olarak ölçen bir yöntemdir.

SEO ve arama motoru algoritmaları söz konusu olduğunda bir içerik içerisinde geçirilmesi gereken anahtar kelime sayısı hakkında bu zamana kadar yazılmış ve söylenmiş birçok kafa karıştırıcı bilgi bulunmaktadır.

Bu yazıda içerik süreçlerinde anahtar kelime kullanımını matematiksel bir boyutta değerlendirmeye imkân tanıyan TF-IDF kavramını derinlemesine inceleyecek, her bir konu başlığını detaylı şekilde açıklayacağız.

Sizler de blog ve içerik stratejinizi kuvvetlendirmek ve gerçekleştirdiğiniz SEO çalışmalarının daha etkili hâle gelebilmesini sağlamak için yazımızı okuyabilirsiniz.

TF-IDF’nin Açılımı Nedir?

TF ya da açılımıyla terms frequency, “terim frekansı” anlamına gelir. Açılımı inverse document frequency olan IDF ise “ters doküman frekansı” ifadesine karşılık gelmektedir.

TF-IDF Nasıl Hesaplanır?

TF-IDF hesaplaması için öncelikle ayrı ayrı TF ve IDF hesaplamasının yapılması gerekir. 

TF (Terms Frequency) Hesaplama

Terim frekansı, belirli bir anahtar kelimenin bir metin içerisinde ne sıklıkla geçirildiğinin ölçülmesini sağlar ve şu şekilde hesaplanır:

  • TF = Belgedeki Terim Sayısı / Belgede Bulunan Toplam Kelime Sayısı

Bu konuyu bir örnekle inceleyelim:

  • Bir web sayfasında 1000 kelimelik bir metin olduğunu varsayalım.
  • Bu kelimenin ana anahtar kelimesinin “SEO” olduğunu düşünelim. 
  • SEO kelimesi metinde 50 kez geçiyor olsun.
  • Bu doğrultuda TF = 50/1000 = 0.05 olacaktır.

IDF (Inverse Document Frequency) Hesaplama

Ters doküman frekansı belirli bir anahtar kelimenin tüm belgeler arasında ne kadar nadir kullanıldığını ölçmek için kullanılır. Bu noktada daha nadiren kullanılan anahtar kelimeler daha yüksek IDF değeri alır.

IDF şu şekilde hesaplanır:

  • IDF = log log { Toplam İçerik Sayısı / Kelimenin Geçtiği İçerik Sayısı }

Bu konuyu da bir örnekle detaylandıralım:

  • Bir veri kümesi düşünelim ve burada 10.000 belge olduğunu varsayalım.
  • Bu belgelerin 100 tanesinin içerisinde “SEO” kelimesinin geçtiğini düşünelim.
  • Bu durumda IDF = log { 10000 / 100  } = 2 olarak hesaplanacaktır.

TF-IDF Hesaplama

TF-IDF hesaplaması yapılırken TF ve IDF değerleri çarpılır ve ilgili anahtar kelimenin önemi böylece hesaplanmış olur.

Yukarıdaki örneklerden yola çıkacak olursak TF-IDF değeri 0.05 * 2 = 0.1 olarak hesaplanacaktır.

TF-IDF’nin SEO Açısından Önemi Nedir?

TF-IDF hesaplaması, içerik optimizasyonu çalışmalarında sıklıkla kullanılır. Bu hesaplama ek olarak arama motoru algoritmaları için de önem taşır. Konuyu SEO söz konusu olduğunda önemli yapan diğer sebepler aşağıda sıralanmıştır:

  • Anahtar Kelime Optimizasyonu: Hedeflenen bir anahtar kelimenin ne kadar sık kullanıldığının hesaplanabilmesini sağlar. Bu sayede sayfanın söz konusu keyword ile olan uyumluluğu artırılabilir, anahtar kelime aşırılığından kaçınılması sağlanabilir.
  • Rakip Analizi: Rakip sayfalardaki TF-IDF değeri hesaplanarak SEO içerik stratejilerinde değişikliğe gidilebilir. Bu noktada iyi performans gösteren, SERP’lerde üst sıralarında listelenen web sitelerinden örnekler almak oldukça önemlidir.
  • İçerik Kalitesi: TF-IDF hesaplaması, içerik ve anahtar kelime uyumunu artırmak için kullanılır. Bu ise içerik kalitesinin artırılması, içeriğin çok daha iyi bir hâle getirilmesi anlamına gelebilir.
  • SEO Stratejisi: TF-IDF kullanımının amacı, içerik ve anahtar kelime optimizasyonu çalışmaları gerçekleştirerek kullanıcı deneyimini artırmaktır. Bilindiği üzere bu aksiyonun kendisi, direkt olarak ayakları yere basan bir SEO stratejisi geliştirilmesi konusunda uzmanlara yardımcı olabilir.

TF-IDF Hesaplamasının Uygulama Alanları

Özetle söylenecek olursa belirli bir içerik stratejisine sahip olan tüm web sitelerinin TF-IDF hesaplama yöntemini kullanarak anahtar kelimeler hakkında bilgi toplamaları ve bu doğrultuda içeriklerini analiz etmeleri beklenir. Bu hesaplamanın kullanıldığı bazı örnek web site kategorileri aşağıda sıralanmıştır.

e-Ticaret Siteleri

Bilindiği üzere e-ticaret web sitelerinin en değerli sayfaları, kategori ve ürünlerin yer aldığı sayfalardır. Örneğin TF-IDF hesaplaması, e-ticaret web sitelerinin ürün sayfalarında kullanıcıların aradığı terimlerin ve rakiplerin kullandığı varyasyonların analiz edilebilmesine olanak sağlar. Bu sayede içeriklerde eksik kalan anahtar kelimeler tespit edilebilir ve içerik optimizasyonu sağlanabilir.

Blog ve İçerik Siteleri

TF-IDF hesaplaması, içerikleri daha detaylı hâle getirmek ve bu sayede kullanıcıların dikkatini daha fazla çekebilmek amacıyla blog ve içerik web sitelerinde de sıklıkla kullanılmaktadır.

Ana anahtar kelimenin dışında kalan bağlantılı anahtar kelimeler de keşfedilebilir. Bu sayede söz konusu sayfanın daha fazla anahtar kelimede impression kazanması sağlanabilir.

Haber Platformları

Haber web sitelerinin neredeyse tüm trafiği, web site içerisinde yer alan içeriklerden gelmektedir. Tahmin edilebildiği üzere bu tür yüksek trafikli web sitelerinin içerik ve anahtar kelime üretimi oldukça zor süreçleri içerebilir.

Bu noktada TF-IDP, başlık ve içeriklerin alaka düzeyini artırmak, yeni anahtar kelimeler keşfetmek ve hatta yeni kategorilerin oluşturulmasını sağlamak amacıyla kullanılabilir.

Örnek TF-IDF Analizi

Yazımızın bu bölümünde TF-IDF analizine ilişkin bir örnek verecek ve konuyu adım adım takip ederek bu analizi nasıl gerçekleştirebileceğinizi açıklayacağız.

Hedef Anahtar Kelimenin Belirlenmesi

Bu aşamada üzerine çalışmak üzere hedef bir anahtar kelime belirlenmelidir. Bu örnekte ilgili kelimeyi “SEO stratejisi” olarak belirleyelim.

Bu keyword’ü Google’da aratalım ve SERP sonuçlarında karşımıza çıkan ilk 10 sıradaki içeriklere odaklanalım.

Rakip İçeriklerin Toplanması

İkinci adımda bir excel dosyası oluşturalım ve bu dosyaya rakip URL’i ve içerik başlığı gibi detayları girelim. Ardından rakiplerin web sitelerinde yer alan içerikleri birbirlerinden ayrı olacak dokümanlara kopyalayalım.

Kelime Frekanslarının Hesaplanması (TF)

Bu adımda her bir içerikte yer alan TF değerinin hesaplanması işlemi yer alacaktır. Tahmin edileceği üzere bu işlemi manuel bir şekilde gerçekleştirmek zorlayıcı olabilir. Bu noktada Screaming Frog SEO Spider aracı kullanılabilir.

Manuel hesaplama yaptığımızı düşünerek ilerleyecek olursak bir içerikte 500 kelime olduğunu ve “SEO stratejisi” kelimesinin 10 kez bu içerikte geçirildiğini düşünelim.

Bu noktada TF değeri = Belgedeki Terim Sayısı / Belgede Bulunan Toplam Kelime Sayısı, 10/500 = 0.02 olarak hesaplanacaktır.

Ters Doküman Frekansının Hesaplanması (IDF)

Bu adımda ise söz konusu anahtar kelimenin genel içerik kümesindeki nadirliğini yani IDF değerini ölçmemiz gerekmektedir.

Burada analiz edilen 10 metnin 5’inde söz konusu anahtar kelimenin geçirildiğini düşünelim.

O hâlde IDF değeri = log { Toplam İçerik Sayısı / Kelimenin Geçtiği İçerik Sayısı }, = log {10/5} = 0.3 olarak hesaplanacaktır.

TF-IDF Değerinin Hesaplanması

TF-IDF değerini ise TF * IDF işlemini uygulayarak 0.02 * 0.3 = 0.006 olarak hesaplayalım.

Tüm İçeriklerin Analiz Edilmesi

Genel matematiksel işlemlerin yapılmasının ardından her web sitesi ve içerikteki TF-IDF skorlarını listeleyin.

Her içerikteki hedef anahtar kelimelerin TF-IDF skorlarını listeleyin. Bunun sonucunda aşağıdaki gibi bir tablo oluşturabilirsiniz.

KelimeTF (Site 1)IDF (Site 1)TF-IDF (Site 1)
SEO Stratejisi0.050.20.01
Backlink0.020.30.006
Optimizasyon0.010.40.004

Ardından bu tabloyu 2, 3 ve devamındaki web siteleri için de uygulayın. Tablonuzu genişletin.

Kıyaslamanın Yapılması

Bu aşamadaysa kendi içeriğinizin TF-IDF hesaplamasını yapmanız gerekmektedir. Bu aksiyon, rakiplerle kıyaslama işleminin mümkün hâle getirilebilmesini sağlayacaktır.

KelimeTF (Siteniz)IDF (Siteniz)TF-IDF (Siteniz)
SEO Stratejisi0.020.20.04
Backlink0 (Eksik)0.30
Optimizasyon0.010.40.004

Bu nokta oldukça kritiktir: Bu aşamada rakiplerin sitesinde ve kendi web sitenizde yer alan (ve TF-IDF’si hesaplanan) anahtar kelimeleri detaylı bir şekilde kıyaslamalı ve eksik ya da az kullanılan anahtar kelimeleri belirlemelisiniz.

Eksik Anahtar Kelimelerin İçeriğe Eklenmesi

Son aşama olan entegrasyon adımındaysa tespit edilen anahtar kelimeleri web sitenizde bulunan içeriğe eklemeniz gerekir. Ekleme işlemi sırasında aklınızdan çıkarmamanız gereken maddelerse aşağıdaki gibidir:

  • Anahtar kelimeleri metin içerisinde kulağa ve göze doğal gelecek şekilde kullanın. Yapay ve gereksiz kullanımlardan kaçının.
  • Anahtar kelimelerinizi heading etiketler, meta title ve meta description, görsel alt etiketleri gibi alanlarda da kullandığınızdan emin olun.
  • “Her içerik X kelime olmalı.” ya da “Bir anahtar kelime bir metinde en az Y kadar geçmek zorunda.” gibi kurallara odaklanmak yerine içeriğin doygunluğuna odaklanın.
  • Yalnızca kullanıcıların faydalanabileceği, doğru ve ilgi çekici içerikler oluşturun.
  • Metni anahtar kelimeye boğacak bir strateji oluşturmamaya dikkat edin. Bu aksiyonun zaman zaman Google tarafından cezalandırıldığını unutmayın.

İçeriği Güncelleyin ve Test İşlemlerini Başlatın

Aksiyon alıp içeriğinizi güncelledikten sonra gerçekleştirilen işlemin verimliliğini ölçmeniz gerekmektedir. Bu, gelecekte tekrarlanacak TF-IDF hesaplama ve aksiyon çalışmalarının çok daha iyi bir şekilde kurgulanıp uygulanabilmesi açısından oldukça önemlidir.

Verimliliği ölçme noktasında öncelikli olarak Google Search Console ve Google Analytics 4 gibi gerçek verilerle çalışan araçları tercih edin. Bu noktada Semrush, Ahrefs ya da Moz gibi ücretli araçları da kullanabilirsiniz.

Özellikle sayfaların impression, click, pozisyon, ctr, hemen çıkma oranı, sayfada geçirilen süre gibi verilerine odaklanın.

Bonus: Python ile TF-IDF Analizi

TF-IDF analizi manuel olarak gerçekleştirildiğinde süreç uzayabilir. Bu durum da çalışmanın veriminin düşmesine yol açabilir.

Yazımızın bölümünde Python kullanarak nasıl TF-IDF analizi yapabileceğinizi açıklayacağız.

Gerekli Kütüphanelerin Yüklenmesi

Aşağıdaki kütüphaneleri sisteminize yükleyin.

  • pip install scikit-learn
  • pip install pandas

Veri Setinin Hazırlanması

Analiz edeceğiniz belge ve dokümanları bir Python listesi olarak hazırlayın ve ekleyin.

# Örnek belgeler

documents = [

    “SEO stratejileri, SEO içerik çalışmalarında daha iyi sıralamalar elde edilmesi için kullanılır.”,

    “Backlink oluşturmak SEO ve içerik çalışmalarında önemli bir adımdır.”,

    “SEO çalışmaları ve içerik stratejileri, web sitelerinin görünürlüğünü artırır.”,

    “İçerik optimizasyonu, anahtar kelimelerin doğru kullanımıyla mümkündür.”

]

TF-IDF Analizinin Yapılması

İlk başta yüklenen scikit learn kütüphanesini kullanarak TF-IDF değerlerini hesaplayın.

# TF-IDF hesaplaması için TfidfVectorizer

vectorizer = TfidfVectorizer()

# TF-IDF matrisini oluşturmak

tfidf_matrix = vectorizer.fit_transform(documents)

# Terimlerin listesi

terms = vectorizer.get_feature_names_out()

# TF-IDF değerlerini DataFrame formatında göstermek

tfidf_df = pd.DataFrame(tfidf_matrix.toarray(), columns=terms)

# Belge bazlı en önemli kelimeleri bulmak

top_terms = []

for i, row in tfidf_df.iterrows():

    top_term = row.idxmax()

    top_value = row.max()

    top_terms.append({“Document”: f”Belge {i + 1}”, “Keyword”: top_term, “TF-IDF Score”: top_value})

top_terms_df = pd.DataFrame(top_terms)

# Genel TF-IDF skorlarının ortalamasını hesaplamak

average_tfidf = tfidf_df.mean().sort_values(ascending=False).reset_index()

average_tfidf.columns = [“Keyword”, “Average TF-IDF Score”]

# DataFrame’leri kullanıcıya sunmak

tools.display_dataframe_to_user(name=”Top Keywords for Each Document”, dataframe=top_terms_df)

tools.display_dataframe_to_user(name=”Average TF-IDF Scores Across All Keywords”, dataframe=average_tfidf)

Çıktının İncelenmesi

Yukarıda yer alan kod, her belge ve anahtar kelime için gerekli incelemeleri yapıp TF, IDF ve TF-IDF değerlerini sizin için aşağıdaki gibi listeleyecektir.

DocumentKeywordTF-IDF Score
Belge 1seo0.39814792863354054
Belge 2adımdır0.37640812281570435
Belge 3artırır0.37640812281570435
Belge 4anahtar0.3779644730092272

Önemli Anahtar Kelimelerin Belirlenmesi

Bu aşamada ise TF-IDF skoru yüksek olan anahtar kelimelere odaklanın ve metninizi optimize etmek için hazırlanın.

Average TF-IDF Scores Across All Keywords

KeywordAverage TF-IDF Score
seo0.219665196637103
içerik0.16989670555791053
ve0.1483822437494752
stratejileri0.135665109533687
çalışmalarında0.135665109533687

Sonuç

TF-IDF, SEO içerik çalışmalarının matematiksel bir temele oturtularak sürdürülebilmesini mümkün kıldığından son derece önemlidir. Bu yazımızda TF-IDF kavramının ne olduğundan, hangi alanlarda sıklıkla kullanıldığından ve nasıl kullanılması gerektiğinden detaylı bir şekilde bahsetmeye çalıştık.

Siz de yazımızda yer alan ipuçlarını kullanarak rakip web sitelerindeki değerli anahtar kelimelerin önem oranını ölçebilir, bu doğrultuda kendi içeriklerinizi güncelleyerek daha iyi bir organik trafik skoru hedefleyebilirsiniz.

blank
İçerikmatik
Beğenebileceğin diğer yazılar
Otoriter İçerikler Markanıza Nasıl Fayda Sağlar? Bu İçerikler Nasıl Üretilmeli?
Otoriter İçerikler Markanıza Nasıl Fayda Sağlar? Bu İçerikler Nasıl Üretilmeli?
İçerik pazarlaması markaların kendilerini doğru şekilde ifade etmelerini ve hedef kitlelerine ulaşmalarını sağlar. İçerik üretiminde fark yaratmanın ve sektörde lider bir konuma gelmenin yolu otoriter ...
20 Kasım 2024
İçerik Haritalama: Müşteri Yolculuğunun Her Aşaması İçin İçerik Oluşturma
İçerik Haritalama: Müşteri Yolculuğunun Her Aşaması İçin İçerik Oluşturma
Müşteri yolculuğu diğer bir adıyla satın alma yolculuğu müşterilerin satın alma işleminden önce geçirdiği süreci ifade eder. Müşteri yolculuğu, müşterilerin bir ürüne ya da hizmete ...
13 Kasım 2024
CLS Nedir? CLS Skorunuzu Nasıl İyileştirebilirsiniz?
CLS Nedir? CLS Skorunuzu Nasıl İyileştirebilirsiniz?
Kullanıcı deneyimi, web sitelerinin performansı ve site trafiği söz konusu olduğunda son derece önemli bir konudur. Kullanıcı deneyimini iyileştirmenin hem kolay hem karmaşık yolları ...
6 Kasım 2024
Markanıza özel içerik üretimine hemen başlayalım!