HTML Tablo Çıkarıcı
HTML kodundaki tablo verilerini anında çıkarın
ve CSV veya Markdown'a dönüştürün.
Çıkarma Sonuçları
Bunu da beğenebilirsiniz
HTML Tablo Çıkarıcı Hakkında
HTML Tablo Çıkarıcı, <table> etiketlerini tanımlamak ve içindeki verileri çıkarmak için HTML kaynak kodunu otomatik olarak ayrıştıran ücretsiz bir web aracıdır. Kazınmış (scraped) HTML içeriğini temizlemek veya eski HTML dosyalarından tablo verilerini çıkarıp elektronik tablo uygulamaları için standart formatlara dönüştürmek için harika bir yardımcıdır.
Araç, verileri CSV, TSV, Markdown ve JSON formatlarında dışa aktarmayı destekler. Tüm işlemler web tarayıcınızda gerçekleştirildiği için, gizli verileriniz veya kişisel bilgileriniz güvende kalır ve harici bir sunucuya gönderilmez.
Nasıl Kullanılır
HTML Yapıştırın
Çıkarmak istediğiniz tabloyu içeren HTML kaynak kodunu giriş alanına yapıştırın. Tüm bir sayfanın kaynak kodunu veya yalnızca tablo parçasını yapıştırabilirsiniz.
Format Seçin
İstediğiniz çıktı formatını seçin: CSV, TSV, Markdown veya JSON. Excel'de açmak için CSV, belgelere yapıştırmak için Markdown mükemmeldir.
Çıkarın ve Kopyalayın
HTML içindeki tüm tabloları anında ayrıştırmak için "Tabloları Çıkar" düğmesine tıklayın. Sonuçlar aşağıda görüntülenecek ve kolayca kopyalayabileceksiniz.
Sözlük
- HTML Table (<table>)
- Bir web sayfasında iki boyutlu tablo verilerini temsil etmek için kullanılan bir HTML öğesi.
<tr>(satırlar),<th>(başlık hücreleri) ve<td>(veri hücreleri) gibi ilgili öğelerden oluşur. - CSV (Comma-Separated Values)
- Veri alanlarını ayırmak için virgül (
,) kullanan basit bir metin biçimidir. Excel ve Google Sheets gibi e-tablo uygulamaları tarafından evrensel olarak kabul edilir. - Markdown Table
- Tablolar oluşturmak için kullanılan metin tabanlı bir biçimlendirme sözdizimi. GitHub, Notion ve Zenn gibi belgeleme araçları tarafından yaygın olarak desteklenir.
- DOM (Document Object Model)
- HTML ve XML belgeleri için bir programlama arayüzü. Bu araç, HTML dizesini güvenle ayrıştırmak için tarayıcının yerel DOMParser API'sini kullanır.
- Rowspan / Colspan
- Hücreleri dikey (rowspan) veya yatay (colspan) olarak birleştirmek için kullanılan HTML nitelikleri. Çıkarıcımız, dönüştürme sırasında veri bütünlüğünü sağlamak için birleştirilmiş hücreleri doğru bir şekilde genişletir.
Sıkça Sorulan Sorular
- Q.HTML verilerim bir sunucuya kaydediliyor mu?
- Hayır, kaydedilmiyor. Bu araç, tüm ayrıştırma ve veri çıkarma işlemlerini JavaScript kullanarak tarayıcınızda yerel olarak gerçekleştirir. Hiçbir veri sunucuya gönderilmediği için gizli bilgilerle bile güvenle kullanabilirsiniz.
- Q.HTML içinde birden fazla tablo varsa ne olur?
- Araç, sağlanan HTML kaynak kodundaki tüm <table> etiketlerini otomatik olarak algılar ve bunları ayrı sonuç kutularına çıkarır. Her tablonun verilerini tek tek kopyalayabilirsiniz.
- Q.Birleştirilmiş hücreleri (rowspan / colspan) destekliyor mu?
- Evet, tamamen destekliyor. HTML birleştirme niteliklerini doğru bir şekilde yorumlar ve dönüştürmeden önce bunları bir matrise (2D dizi) uygun şekilde genişleterek verilerin eksik veya yanlış hizalanmış olmamasını sağlar.
- Q.Bozuk veya eksik HTML'den veri çıkarabilir mi?
- Tarayıcının yerleşik HTML ayrıştırıcısını (DOMParser) kullandığımız için, tarayıcıların tolere edebileceği küçük sözdizimi hataları otomatik olarak düzeltilir. Ancak, yapı tamamen bozuksa doğru okunamayabilir.
- Q.Çıkarılan CSV Excel'de açıldığında bozuk karakterler gösteriyor.
- Excel, UTF-8 kodlu CSV dosyalarını bazen doğru şekilde görüntüleyemez. Excel'in 'Veri' sekmesinden 'Metin/CSV'den' seçeneğini kullanarak içe aktararak veya dosyayı bir metin düzenleyicide açıp BOM'lu UTF-8 olarak kaydederek bu sorunu çözebilirsiniz.
Kullanım Senaryoları
Veri Temizleme
Python gibi otomatik komut dosyaları aracılığıyla elde edilen ham HTML'den yapılandırılmış tablo verilerini kolayca çıkarın ve CSV olarak düzenli bir şekilde kaydedin.
Markdown Belgeleri
Web sayfalarındaki mevcut spesifikasyon tablolarını doğrudan GitHub Benioku'larına (readmes) veya Notion belgelerine yapıştırmak üzere hızla Markdown formatına dönüştürün.
Veri Analizi Hazırlığı
İş Zekası (BI) araçlarını veya e-tabloları kullanarak veri analizi iş akışınızı hızlandırmak için karmaşık, iç içe geçmiş HTML tablolarından verileri JSON veya TSV olarak ayıklayın.
Eski Sistem Göçü
Eski sistemler tarafından oluşturulan HTML raporlarını, modern veritabanlarına içe aktarmak üzere ara CSV verileri oluşturmak için ayrıştırma sürecini otomatikleştirin.
Teknik Detaylar
DOMParser
HTML'nin esnek yapısını doğru bir şekilde yorumlamak için, bu araç düzenli ifadelere (regex) güvenmek yerine tarayıcının yerel DOMParser özelliğini kullanır. Bu, regex'in işleyemeyeceği iç içe tabloları ve karmaşık nitelikleri tarayıcıya eşdeğer bir hassasiyetle yönetmeyi sağlar.
Ayrıca, XSS (Siteler Arası Komut Dosyası Çalıştırma) risklerini ortadan kaldırmak için ayrıştırma işlemi, yerleşik komut dosyaları çalıştırılmadan güvenli bir şekilde gerçekleştirilir. Veriler yalnızca textContent özelliği üzerinden elde edilir.
Geri Bildirim Gönder
Aracı geliştirmemize yardımcı olmak için lütfen düşüncelerinizi bize bildirin.
Geri bildirim geçici olarak askıya alındı
Sunucu meşgul veya spam koruması etkin. Lütfen daha sonra tekrar deneyin.