TF-IDF (Term Frequency-Inverse Document Frequency) kavramı, belirli bir anahtar kelimenin içerik içerisindeki tekrarlanma sıklığını matematiksel olarak ölçen bir yöntemdir.
SEO ve arama motoru algoritmaları söz konusu olduğunda bir içerik içerisinde geçirilmesi gereken anahtar kelime sayısı hakkında bu zamana kadar yazılmış ve söylenmiş birçok kafa karıştırıcı bilgi bulunmaktadır.
Bu yazıda içerik süreçlerinde anahtar kelime kullanımını matematiksel bir boyutta değerlendirmeye imkân tanıyan TF-IDF kavramını derinlemesine inceleyecek, her bir konu başlığını detaylı şekilde açıklayacağız.
Sizler de blog ve içerik stratejinizi kuvvetlendirmek ve gerçekleştirdiğiniz SEO çalışmalarının daha etkili hâle gelebilmesini sağlamak için yazımızı okuyabilirsiniz.
TF-IDF’nin Açılımı Nedir?
TF ya da açılımıyla terms frequency, “terim frekansı” anlamına gelir. Açılımı inverse document frequency olan IDF ise “ters doküman frekansı” ifadesine karşılık gelmektedir.
TF-IDF Nasıl Hesaplanır?
TF-IDF hesaplaması için öncelikle ayrı ayrı TF ve IDF hesaplamasının yapılması gerekir.
TF (Terms Frequency) Hesaplama
Terim frekansı, belirli bir anahtar kelimenin bir metin içerisinde ne sıklıkla geçirildiğinin ölçülmesini sağlar ve şu şekilde hesaplanır:
- TF = Belgedeki Terim Sayısı / Belgede Bulunan Toplam Kelime Sayısı
Bu konuyu bir örnekle inceleyelim:
- Bir web sayfasında 1000 kelimelik bir metin olduğunu varsayalım.
- Bu kelimenin ana anahtar kelimesinin “SEO” olduğunu düşünelim.
- SEO kelimesi metinde 50 kez geçiyor olsun.
- Bu doğrultuda TF = 50/1000 = 0.05 olacaktır.
IDF (Inverse Document Frequency) Hesaplama
Ters doküman frekansı belirli bir anahtar kelimenin tüm belgeler arasında ne kadar nadir kullanıldığını ölçmek için kullanılır. Bu noktada daha nadiren kullanılan anahtar kelimeler daha yüksek IDF değeri alır.
IDF şu şekilde hesaplanır:
- IDF = log log { Toplam İçerik Sayısı / Kelimenin Geçtiği İçerik Sayısı }
Bu konuyu da bir örnekle detaylandıralım:
- Bir veri kümesi düşünelim ve burada 10.000 belge olduğunu varsayalım.
- Bu belgelerin 100 tanesinin içerisinde “SEO” kelimesinin geçtiğini düşünelim.
- Bu durumda IDF = log { 10000 / 100 } = 2 olarak hesaplanacaktır.
TF-IDF Hesaplama
TF-IDF hesaplaması yapılırken TF ve IDF değerleri çarpılır ve ilgili anahtar kelimenin önemi böylece hesaplanmış olur.
Yukarıdaki örneklerden yola çıkacak olursak TF-IDF değeri 0.05 * 2 = 0.1 olarak hesaplanacaktır.
TF-IDF’nin SEO Açısından Önemi Nedir?
TF-IDF hesaplaması, içerik optimizasyonu çalışmalarında sıklıkla kullanılır. Bu hesaplama ek olarak arama motoru algoritmaları için de önem taşır. Konuyu SEO söz konusu olduğunda önemli yapan diğer sebepler aşağıda sıralanmıştır:
- Anahtar Kelime Optimizasyonu: Hedeflenen bir anahtar kelimenin ne kadar sık kullanıldığının hesaplanabilmesini sağlar. Bu sayede sayfanın söz konusu keyword ile olan uyumluluğu artırılabilir, anahtar kelime aşırılığından kaçınılması sağlanabilir.
- Rakip Analizi: Rakip sayfalardaki TF-IDF değeri hesaplanarak SEO içerik stratejilerinde değişikliğe gidilebilir. Bu noktada iyi performans gösteren, SERP’lerde üst sıralarında listelenen web sitelerinden örnekler almak oldukça önemlidir.
- İçerik Kalitesi: TF-IDF hesaplaması, içerik ve anahtar kelime uyumunu artırmak için kullanılır. Bu ise içerik kalitesinin artırılması, içeriğin çok daha iyi bir hâle getirilmesi anlamına gelebilir.
- SEO Stratejisi: TF-IDF kullanımının amacı, içerik ve anahtar kelime optimizasyonu çalışmaları gerçekleştirerek kullanıcı deneyimini artırmaktır. Bilindiği üzere bu aksiyonun kendisi, direkt olarak ayakları yere basan bir SEO stratejisi geliştirilmesi konusunda uzmanlara yardımcı olabilir.
TF-IDF Hesaplamasının Uygulama Alanları
Özetle söylenecek olursa belirli bir içerik stratejisine sahip olan tüm web sitelerinin TF-IDF hesaplama yöntemini kullanarak anahtar kelimeler hakkında bilgi toplamaları ve bu doğrultuda içeriklerini analiz etmeleri beklenir. Bu hesaplamanın kullanıldığı bazı örnek web site kategorileri aşağıda sıralanmıştır.
e-Ticaret Siteleri
Bilindiği üzere e-ticaret web sitelerinin en değerli sayfaları, kategori ve ürünlerin yer aldığı sayfalardır. Örneğin TF-IDF hesaplaması, e-ticaret web sitelerinin ürün sayfalarında kullanıcıların aradığı terimlerin ve rakiplerin kullandığı varyasyonların analiz edilebilmesine olanak sağlar. Bu sayede içeriklerde eksik kalan anahtar kelimeler tespit edilebilir ve içerik optimizasyonu sağlanabilir.
Blog ve İçerik Siteleri
TF-IDF hesaplaması, içerikleri daha detaylı hâle getirmek ve bu sayede kullanıcıların dikkatini daha fazla çekebilmek amacıyla blog ve içerik web sitelerinde de sıklıkla kullanılmaktadır.
Ana anahtar kelimenin dışında kalan bağlantılı anahtar kelimeler de keşfedilebilir. Bu sayede söz konusu sayfanın daha fazla anahtar kelimede impression kazanması sağlanabilir.
Haber Platformları
Haber web sitelerinin neredeyse tüm trafiği, web site içerisinde yer alan içeriklerden gelmektedir. Tahmin edilebildiği üzere bu tür yüksek trafikli web sitelerinin içerik ve anahtar kelime üretimi oldukça zor süreçleri içerebilir.
Bu noktada TF-IDP, başlık ve içeriklerin alaka düzeyini artırmak, yeni anahtar kelimeler keşfetmek ve hatta yeni kategorilerin oluşturulmasını sağlamak amacıyla kullanılabilir.
Örnek TF-IDF Analizi
Yazımızın bu bölümünde TF-IDF analizine ilişkin bir örnek verecek ve konuyu adım adım takip ederek bu analizi nasıl gerçekleştirebileceğinizi açıklayacağız.
Hedef Anahtar Kelimenin Belirlenmesi
Bu aşamada üzerine çalışmak üzere hedef bir anahtar kelime belirlenmelidir. Bu örnekte ilgili kelimeyi “SEO stratejisi” olarak belirleyelim.
Bu keyword’ü Google’da aratalım ve SERP sonuçlarında karşımıza çıkan ilk 10 sıradaki içeriklere odaklanalım.
Rakip İçeriklerin Toplanması
İkinci adımda bir excel dosyası oluşturalım ve bu dosyaya rakip URL’i ve içerik başlığı gibi detayları girelim. Ardından rakiplerin web sitelerinde yer alan içerikleri birbirlerinden ayrı olacak dokümanlara kopyalayalım.
Kelime Frekanslarının Hesaplanması (TF)
Bu adımda her bir içerikte yer alan TF değerinin hesaplanması işlemi yer alacaktır. Tahmin edileceği üzere bu işlemi manuel bir şekilde gerçekleştirmek zorlayıcı olabilir. Bu noktada Screaming Frog SEO Spider aracı kullanılabilir.
Manuel hesaplama yaptığımızı düşünerek ilerleyecek olursak bir içerikte 500 kelime olduğunu ve “SEO stratejisi” kelimesinin 10 kez bu içerikte geçirildiğini düşünelim.
Bu noktada TF değeri = Belgedeki Terim Sayısı / Belgede Bulunan Toplam Kelime Sayısı, 10/500 = 0.02 olarak hesaplanacaktır.
Ters Doküman Frekansının Hesaplanması (IDF)
Bu adımda ise söz konusu anahtar kelimenin genel içerik kümesindeki nadirliğini yani IDF değerini ölçmemiz gerekmektedir.
Burada analiz edilen 10 metnin 5’inde söz konusu anahtar kelimenin geçirildiğini düşünelim.
O hâlde IDF değeri = log { Toplam İçerik Sayısı / Kelimenin Geçtiği İçerik Sayısı }, = log {10/5} = 0.3 olarak hesaplanacaktır.
TF-IDF Değerinin Hesaplanması
TF-IDF değerini ise TF * IDF işlemini uygulayarak 0.02 * 0.3 = 0.006 olarak hesaplayalım.
Tüm İçeriklerin Analiz Edilmesi
Genel matematiksel işlemlerin yapılmasının ardından her web sitesi ve içerikteki TF-IDF skorlarını listeleyin.
Her içerikteki hedef anahtar kelimelerin TF-IDF skorlarını listeleyin. Bunun sonucunda aşağıdaki gibi bir tablo oluşturabilirsiniz.
Kelime | TF (Site 1) | IDF (Site 1) | TF-IDF (Site 1) |
SEO Stratejisi | 0.05 | 0.2 | 0.01 |
Backlink | 0.02 | 0.3 | 0.006 |
Optimizasyon | 0.01 | 0.4 | 0.004 |
Ardından bu tabloyu 2, 3 ve devamındaki web siteleri için de uygulayın. Tablonuzu genişletin.
Kıyaslamanın Yapılması
Bu aşamadaysa kendi içeriğinizin TF-IDF hesaplamasını yapmanız gerekmektedir. Bu aksiyon, rakiplerle kıyaslama işleminin mümkün hâle getirilebilmesini sağlayacaktır.
Kelime | TF (Siteniz) | IDF (Siteniz) | TF-IDF (Siteniz) |
SEO Stratejisi | 0.02 | 0.2 | 0.04 |
Backlink | 0 (Eksik) | 0.3 | 0 |
Optimizasyon | 0.01 | 0.4 | 0.004 |
Bu nokta oldukça kritiktir: Bu aşamada rakiplerin sitesinde ve kendi web sitenizde yer alan (ve TF-IDF’si hesaplanan) anahtar kelimeleri detaylı bir şekilde kıyaslamalı ve eksik ya da az kullanılan anahtar kelimeleri belirlemelisiniz.
Eksik Anahtar Kelimelerin İçeriğe Eklenmesi
Son aşama olan entegrasyon adımındaysa tespit edilen anahtar kelimeleri web sitenizde bulunan içeriğe eklemeniz gerekir. Ekleme işlemi sırasında aklınızdan çıkarmamanız gereken maddelerse aşağıdaki gibidir:
- Anahtar kelimeleri metin içerisinde kulağa ve göze doğal gelecek şekilde kullanın. Yapay ve gereksiz kullanımlardan kaçının.
- Anahtar kelimelerinizi heading etiketler, meta title ve meta description, görsel alt etiketleri gibi alanlarda da kullandığınızdan emin olun.
- “Her içerik X kelime olmalı.” ya da “Bir anahtar kelime bir metinde en az Y kadar geçmek zorunda.” gibi kurallara odaklanmak yerine içeriğin doygunluğuna odaklanın.
- Yalnızca kullanıcıların faydalanabileceği, doğru ve ilgi çekici içerikler oluşturun.
- Metni anahtar kelimeye boğacak bir strateji oluşturmamaya dikkat edin. Bu aksiyonun zaman zaman Google tarafından cezalandırıldığını unutmayın.
İçeriği Güncelleyin ve Test İşlemlerini Başlatın
Aksiyon alıp içeriğinizi güncelledikten sonra gerçekleştirilen işlemin verimliliğini ölçmeniz gerekmektedir. Bu, gelecekte tekrarlanacak TF-IDF hesaplama ve aksiyon çalışmalarının çok daha iyi bir şekilde kurgulanıp uygulanabilmesi açısından oldukça önemlidir.
Verimliliği ölçme noktasında öncelikli olarak Google Search Console ve Google Analytics 4 gibi gerçek verilerle çalışan araçları tercih edin. Bu noktada Semrush, Ahrefs ya da Moz gibi ücretli araçları da kullanabilirsiniz.
Özellikle sayfaların impression, click, pozisyon, ctr, hemen çıkma oranı, sayfada geçirilen süre gibi verilerine odaklanın.
Bonus: Python ile TF-IDF Analizi
TF-IDF analizi manuel olarak gerçekleştirildiğinde süreç uzayabilir. Bu durum da çalışmanın veriminin düşmesine yol açabilir.
Yazımızın bölümünde Python kullanarak nasıl TF-IDF analizi yapabileceğinizi açıklayacağız.
Gerekli Kütüphanelerin Yüklenmesi
Aşağıdaki kütüphaneleri sisteminize yükleyin.
- pip install scikit-learn
- pip install pandas
Veri Setinin Hazırlanması
Analiz edeceğiniz belge ve dokümanları bir Python listesi olarak hazırlayın ve ekleyin.
# Örnek belgeler
documents = [
“SEO stratejileri, SEO içerik çalışmalarında daha iyi sıralamalar elde edilmesi için kullanılır.”,
“Backlink oluşturmak SEO ve içerik çalışmalarında önemli bir adımdır.”,
“SEO çalışmaları ve içerik stratejileri, web sitelerinin görünürlüğünü artırır.”,
“İçerik optimizasyonu, anahtar kelimelerin doğru kullanımıyla mümkündür.”
]
TF-IDF Analizinin Yapılması
İlk başta yüklenen scikit learn kütüphanesini kullanarak TF-IDF değerlerini hesaplayın.
# TF-IDF hesaplaması için TfidfVectorizer
vectorizer = TfidfVectorizer()
# TF-IDF matrisini oluşturmak
tfidf_matrix = vectorizer.fit_transform(documents)
# Terimlerin listesi
terms = vectorizer.get_feature_names_out()
# TF-IDF değerlerini DataFrame formatında göstermek
tfidf_df = pd.DataFrame(tfidf_matrix.toarray(), columns=terms)
# Belge bazlı en önemli kelimeleri bulmak
top_terms = []
for i, row in tfidf_df.iterrows():
top_term = row.idxmax()
top_value = row.max()
top_terms.append({“Document”: f”Belge {i + 1}”, “Keyword”: top_term, “TF-IDF Score”: top_value})
top_terms_df = pd.DataFrame(top_terms)
# Genel TF-IDF skorlarının ortalamasını hesaplamak
average_tfidf = tfidf_df.mean().sort_values(ascending=False).reset_index()
average_tfidf.columns = [“Keyword”, “Average TF-IDF Score”]
# DataFrame’leri kullanıcıya sunmak
tools.display_dataframe_to_user(name=”Top Keywords for Each Document”, dataframe=top_terms_df)
tools.display_dataframe_to_user(name=”Average TF-IDF Scores Across All Keywords”, dataframe=average_tfidf)
Çıktının İncelenmesi
Yukarıda yer alan kod, her belge ve anahtar kelime için gerekli incelemeleri yapıp TF, IDF ve TF-IDF değerlerini sizin için aşağıdaki gibi listeleyecektir.
Document | Keyword | TF-IDF Score |
Belge 1 | seo | 0.39814792863354054 |
Belge 2 | adımdır | 0.37640812281570435 |
Belge 3 | artırır | 0.37640812281570435 |
Belge 4 | anahtar | 0.3779644730092272 |
Önemli Anahtar Kelimelerin Belirlenmesi
Bu aşamada ise TF-IDF skoru yüksek olan anahtar kelimelere odaklanın ve metninizi optimize etmek için hazırlanın.
Average TF-IDF Scores Across All Keywords
Keyword | Average TF-IDF Score |
seo | 0.219665196637103 |
içerik | 0.16989670555791053 |
ve | 0.1483822437494752 |
stratejileri | 0.135665109533687 |
çalışmalarında | 0.135665109533687 |
Sonuç
TF-IDF, SEO içerik çalışmalarının matematiksel bir temele oturtularak sürdürülebilmesini mümkün kıldığından son derece önemlidir. Bu yazımızda TF-IDF kavramının ne olduğundan, hangi alanlarda sıklıkla kullanıldığından ve nasıl kullanılması gerektiğinden detaylı bir şekilde bahsetmeye çalıştık.
Siz de yazımızda yer alan ipuçlarını kullanarak rakip web sitelerindeki değerli anahtar kelimelerin önem oranını ölçebilir, bu doğrultuda kendi içeriklerinizi güncelleyerek daha iyi bir organik trafik skoru hedefleyebilirsiniz.