Önceki bölümde koordinatları olan bir metin dizisi haline getirdiğim sandık sonuç formlarını işlemek için yazdığım C programına bu linklerden erişebilirsiniz: [C] [HTML].
Bu programın açık ve erişilebilir olması, yaptığım analizlerin güvenilirliği açısından büyük önem taşıyor.
Programın nasıl çalıştığını kısaca özetlemek gerekirse, öncelikle tüm metni satırlara bölüyorum. Y koordinat aralığı çakışan tüm kelimeler aynı satırda olacak şekilde. Ardından, sandık sonuçlarının başladığı (başlık satırı) ve bittiği (toplam ve genel toplam satırları) satırları tespit edip, bu aralıktaki tüm satırları benzer bir algoritma ile kolonlara bölüyorum. Satır ve kolon kesişimlerinden tablo hücrelerini oluşturuyorum. Son olarak tüm sayfalardaki toplamı ve en sondaki genel toplamı bu hücrelerdeki değerleri kullanarak hesaplayıp doğruluğunu kontrol ettikten sonra sonucu bir metin dosyasına yazdırıyorum.
Diğer detayları ve sonuçları bir sonraki yazıda inceleyeceğim.
Program OpenBSD altında derlenmektedir. Diğer işletim sistemlerinde derlemek için ağaç ve liste başlık dosyalarına ihtiyaç duyabilirsiniz.
Kaydol:
Kayıt Yorumları (Atom)
Hiç yorum yok:
Yorum Gönder