2019年9月24日火曜日

pdfの文書をエクセル文書にするソフトを使ってみての感想


qgis という無料の地理情報システムのソフトを使いはじめて、エクセルとcsv を扱うことが多くなった。
 他者からpdfの一覧表の形式でもらった資料ではも一つピンとこない場合が多い。
 で。
 これを、pdf→エクセル→csvとして、gisに読み込ませ、地図上に表示させたい(実質的な内容もクリックすれば表として表示される形に)と考えた。<読み込ませる前に、経度・緯度という位置情報を拾わなければならないが---

 変換ソフトは、☓☓pdf というものを使った。
 このソフトでは、ページを指定することはできない。
 指定したpdfの文章をまるごと、エクセルの形にしてしまう。

 結果として、エクセルの形にはなる。
 数字などの認識もほぼ間違ってはいない。
 ただ、表示された位置がばらついてしまうのだ。

 gisへ読み込ませるデータとして使うためには、一行ごとのデータにまとめなければならない。
 その部分は、どうしても手作業となってしまう。

 元データの一覧表が、かなりばらついたものであったから、致し方のないことなのだろうな。
 文字認識の精度がかなり高いので、その部分のことを考えると、すべてを手作業でやるよりは、一旦、pdf→エクセルデータ とした方が、多少は手間が省けるのではあるまいか。