5.00 / 1 oy

Scrapy sonuçlarını export etmek (json, xml, csv)

Scrapy ile oluşturduğunuz projedeki bir spider'ı kullanarak bir internet sitesinde istediğiniz alanları terminalde listelediyseniz, scrape ettiğiniz bu bilgileri kullanabilmek için bir txt dosyasına kopyala yapıştır yapmak işinize muhtemelen yaramayacakır. Çünkü bu verileri muhtemelen farklı bir projede biçimlendirilmiş veri olarak kullanmak için zaten scraping işlemini yapmışsınızdır ve düzenli olarak tarama işlemleri de devam edecekse her seferinde copy paste ile export etmek ve sonrasında da biçimlendirmek büyük bir zaman kaybı olur.

Scrapy'nin kendi içerisinde scraping sonuçlarını export edebilmeniz için zaten hazır kodlar bulunuyor ve bu kodları kullanarak terminalinizde listelediğiniz sayfa içeriklerini csv, xml ve json gibi formatlarda export edebilirsiniz.

Örneğin "orumcek" adında bir spider yazdıysanız bu spider'ı çalıştırmak için normalda aşağıdaki kodu kullanırsınız:

scrapy crawl orumcek

Sonuçlarınızı bir json dosyasına export etmek için kodunuzu şu şekilde yazmalısınız:

scrapy crawl orumcek -o dosyaadi.json

Benzer şekilde xml ve csv formatlarında export alabilmek için de yine aşağıdaki terminal kodlarını kullanabilirsiniz.

scrapy crawl orumcek -o dosyaadi.csv

XML için:

scrapy crawl orumcek -o dosyaadi.xml

 

Editör editi: sitede daha önce paylaşılan bazı diğer benzer yazılar için;

bkz: Web Scraping Nedir?

bkz: Scrapy ile yeni bir proje açmak

bkz: Scrapy Nedir ve Nasıl Kullanılır?

bkz: Chrome Bağlantınız gizli değil hatası ve çözümü

bkz: Chrome Bağlantınız gizli değil hatası ve çözümü

bkz: Chrome uzaktan masaüstü nedir ve ne işe yarar?

bora34

20.05.2021 10:06

Bu soru henüz yanıtlanmamış.

Bu soruya sadece kayıtlı kullanıcılar yanıt yazabilirler. Yanıt yazmak için lütfen giriş yapınız.

Reitix
Scrapy sonuçlarını export etmek (json, xml, csv)

İnternet sitemizdeki deneyiminizi iyileştirmek için çerezler kullanıyoruz. Bu siteye giriş yaparak çerez kullanımını kabul etmiş sayılıyorsunuz. Daha fazla bilgi.