digtools
🧮
html table extractor,

HTML Tablo Çıkarıcı

HTML kodundaki tablo verilerini anında çıkarınve CSV veya Markdown'a dönüştürün.

🔄
Çoklu Formatlar
CSV / TSV / Markdown / JSON
🧩
Birleştirilmiş Hücreler
Rowspan / colspan doğru işlenir
🔒
%100 Güvenli ve Yerel
Sunucuya hiçbir veri gönderilmez
about,

HTML Tablo Çıkarıcı Hakkında

HTML Tablo Çıkarıcı, <table> etiketlerini tanımlamak ve içindeki verileri çıkarmak için HTML kaynak kodunu otomatik olarak ayrıştıran ücretsiz bir web aracıdır. Kazınmış (scraped) HTML içeriğini temizlemek veya eski HTML dosyalarından tablo verilerini çıkarıp elektronik tablo uygulamaları için standart formatlara dönüştürmek için harika bir yardımcıdır.

Araç, verileri CSV, TSV, Markdown ve JSON formatlarında dışa aktarmayı destekler. Tüm işlemler web tarayıcınızda gerçekleştirildiği için, gizli verileriniz veya kişisel bilgileriniz güvende kalır ve harici bir sunucuya gönderilmez.

howto,

Nasıl Kullanılır

STEP 1

HTML Yapıştırın

Çıkarmak istediğiniz tabloyu içeren HTML kaynak kodunu giriş alanına yapıştırın. Tüm bir sayfanın kaynak kodunu veya yalnızca tablo parçasını yapıştırabilirsiniz.

STEP 2

Format Seçin

İstediğiniz çıktı formatını seçin: CSV, TSV, Markdown veya JSON. Excel'de açmak için CSV, belgelere yapıştırmak için Markdown mükemmeldir.

STEP 3

Çıkarın ve Kopyalayın

HTML içindeki tüm tabloları anında ayrıştırmak için "Tabloları Çıkar" düğmesine tıklayın. Sonuçlar aşağıda görüntülenecek ve kolayca kopyalayabileceksiniz.

glossary,

Sözlük

HTML Table (<table>)
Bir web sayfasında iki boyutlu tablo verilerini temsil etmek için kullanılan bir HTML öğesi. <tr> (satırlar), <th> (başlık hücreleri) ve <td> (veri hücreleri) gibi ilgili öğelerden oluşur.
CSV (Comma-Separated Values)
Veri alanlarını ayırmak için virgül (,) kullanan basit bir metin biçimidir. Excel ve Google Sheets gibi e-tablo uygulamaları tarafından evrensel olarak kabul edilir.
Markdown Table
Tablolar oluşturmak için kullanılan metin tabanlı bir biçimlendirme sözdizimi. GitHub, Notion ve Zenn gibi belgeleme araçları tarafından yaygın olarak desteklenir.
DOM (Document Object Model)
HTML ve XML belgeleri için bir programlama arayüzü. Bu araç, HTML dizesini güvenle ayrıştırmak için tarayıcının yerel DOMParser API'sini kullanır.
Rowspan / Colspan
Hücreleri dikey (rowspan) veya yatay (colspan) olarak birleştirmek için kullanılan HTML nitelikleri. Çıkarıcımız, dönüştürme sırasında veri bütünlüğünü sağlamak için birleştirilmiş hücreleri doğru bir şekilde genişletir.
faq,

Sıkça Sorulan Sorular

Q.HTML verilerim bir sunucuya kaydediliyor mu?
Hayır, kaydedilmiyor. Bu araç, tüm ayrıştırma ve veri çıkarma işlemlerini JavaScript kullanarak tarayıcınızda yerel olarak gerçekleştirir. Hiçbir veri sunucuya gönderilmediği için gizli bilgilerle bile güvenle kullanabilirsiniz.
Q.HTML içinde birden fazla tablo varsa ne olur?
Araç, sağlanan HTML kaynak kodundaki tüm <table> etiketlerini otomatik olarak algılar ve bunları ayrı sonuç kutularına çıkarır. Her tablonun verilerini tek tek kopyalayabilirsiniz.
Q.Birleştirilmiş hücreleri (rowspan / colspan) destekliyor mu?
Evet, tamamen destekliyor. HTML birleştirme niteliklerini doğru bir şekilde yorumlar ve dönüştürmeden önce bunları bir matrise (2D dizi) uygun şekilde genişleterek verilerin eksik veya yanlış hizalanmış olmamasını sağlar.
Q.Bozuk veya eksik HTML'den veri çıkarabilir mi?
Tarayıcının yerleşik HTML ayrıştırıcısını (DOMParser) kullandığımız için, tarayıcıların tolere edebileceği küçük sözdizimi hataları otomatik olarak düzeltilir. Ancak, yapı tamamen bozuksa doğru okunamayabilir.
Q.Çıkarılan CSV Excel'de açıldığında bozuk karakterler gösteriyor.
Excel, UTF-8 kodlu CSV dosyalarını bazen doğru şekilde görüntüleyemez. Excel'in 'Veri' sekmesinden 'Metin/CSV'den' seçeneğini kullanarak içe aktararak veya dosyayı bir metin düzenleyicide açıp BOM'lu UTF-8 olarak kaydederek bu sorunu çözebilirsiniz.
use cases,

Kullanım Senaryoları

🔍

Veri Temizleme

Python gibi otomatik komut dosyaları aracılığıyla elde edilen ham HTML'den yapılandırılmış tablo verilerini kolayca çıkarın ve CSV olarak düzenli bir şekilde kaydedin.

📝

Markdown Belgeleri

Web sayfalarındaki mevcut spesifikasyon tablolarını doğrudan GitHub Benioku'larına (readmes) veya Notion belgelerine yapıştırmak üzere hızla Markdown formatına dönüştürün.

📊

Veri Analizi Hazırlığı

İş Zekası (BI) araçlarını veya e-tabloları kullanarak veri analizi iş akışınızı hızlandırmak için karmaşık, iç içe geçmiş HTML tablolarından verileri JSON veya TSV olarak ayıklayın.

🔄

Eski Sistem Göçü

Eski sistemler tarafından oluşturulan HTML raporlarını, modern veritabanlarına içe aktarmak üzere ara CSV verileri oluşturmak için ayrıştırma sürecini otomatikleştirin.

technology,

Teknik Detaylar

DOMParser

HTML'nin esnek yapısını doğru bir şekilde yorumlamak için, bu araç düzenli ifadelere (regex) güvenmek yerine tarayıcının yerel DOMParser özelliğini kullanır. Bu, regex'in işleyemeyeceği iç içe tabloları ve karmaşık nitelikleri tarayıcıya eşdeğer bir hassasiyetle yönetmeyi sağlar.

Ayrıca, XSS (Siteler Arası Komut Dosyası Çalıştırma) risklerini ortadan kaldırmak için ayrıştırma işlemi, yerleşik komut dosyaları çalıştırılmadan güvenli bir şekilde gerçekleştirilir. Veriler yalnızca textContent özelliği üzerinden elde edilir.

Geri Bildirim Gönder

Aracı geliştirmemize yardımcı olmak için lütfen düşüncelerinizi bize bildirin.

Sorumluluk Reddi

Bu sitede sunulan araçların tamamı ücretsiz kullanılabilir; ancak kendi sorumluluğunuzda kullanınız. Herhangi bir hesaplama sonucu, dönüşüm sonucu veya oluşturulan verinin doğruluğu, eksiksizliği ya da güvenliği konusunda hiçbir garanti vermiyoruz. Bu araçların kullanımından kaynaklanabilecek zarar veya sorunlar için işletmecinin herhangi bir sorumluluk kabul etmediğini lütfen bilin. Araçların çoğu dosyaları ve hesaplamaları tarayıcınızda yerel olarak işler; bu, girdiğiniz verilerin sunucularımıza gönderilmediği veya depolanmadığı anlamına gelir.