Stvarno in imensko kazalo iz PDF datoteke

Problem: imamo PDF datoteko (npr. knjigo) in bi želeli narediti stvarno in imensko kazalo.

Stvarno in imensko kazalo je bilo sicer narejeno v originalni MS Word ali OpenOffice Writer datoteki, vendar se je ob prelomu paginacija strani podrla in je zato potrebno stvarno in imensko kazalo zgraditi na novo.

Kaj potrebujemo

Linux z pdftools ter openOffice.org. Priporočljivo je uporabiti najnovejšo različico Ubuntu Linux.

Priprava PDF datoteke

Predpostavimo, da imamo datoteko z imenom “nadzor_in_zasebnost_v_informacijski_druzbi_kovacic_2006.pdf”.

Datoteko shranimo na namizje v mapo “kazalo” in zaženemo ukazno vrstico ter gremo do datoteke:

cd Desktop/kazalo/

Datoteko pretvorimo v tekstovni format:

pdftotext nadzor_in_zasebnost_v_informacijski_druzbi_kovacic_2006.pdf 

Mimogrede: shranjevanje v tekstovni format v Adobe PDF Readerju ne deluje ustrezno, saj Adobe PDF Reader ne zna pravilno vstaviti prelomov strani.

Pdftotext pa datoteko pretvori v .TXT datoteko (dobimo datoteko nadzor_in_zasebnost_v_informacijski_druzbi_kovacic_2006.txt), ki ima pravino vstavljene prelome strani.

Sedaj datoteko odpremo v OpenOffice.org, ki ga najdemo v meniju Programi - Pisarna - OpenOffice.org Word Processor.

Datoteko uvozimo z izbiro Datoteka - Odpri in izberemo .TXT datoteko.

Sedaj je potrebno zmanjšati velikost črk, kar storimo tako, da najprej izberemo celotno besedilo (pritisnemo Ctrl-A) in nato nastavimo velikost pisave na recimo 6 pik.

S tem, ko smo pisavo zmanjšali, smo zagotovili, da je vsaka stran iz PDF-ja na svoji strani. Če je velikost pisave prevelika, se namreč lahko zgodi, da bo neka stran iz PDf dokumenta “raztegnjena” čez dve strani v OpenOfficu, kar nam podre paginacijo.

V naslednjem koraku izbrišemo tisto besedilo (na uvodnih in zaključnih straneh), ki ga ne želimo vključiti v kazalo. Pozor: izbrišemo samo besedilo, strani pustimo prazne. Če recimo v kazalo ne želimo vključiti prvih pet strani, morajo biti te strani prazne (strani še vedno obstajajo, le besedila ni na njih).

Datoteko sedaj lahko shranimo.

Priprava ključnih besed za kazalo

V naslednjem koraku je potrebno pripraviti besede za stvarno kazalo. OpenOffice seznam besed prebere iz tim. konkordančne datoteke, ki se nahaja v SDI formatu. Sliši se zapleteno, a SDI format je v bistvu navadna tekstovna datoteka s polji, ločenimi spodpičji.

V programu za delo s preglednicami - OpenOffice Spreadsheet - si pripravimo datoteko ki vsebuje 6 stolpcev:

  1. iskalni niz
  2. prikaz
  3. 1. ključ
  4. 2. ključ
  5. razlikuj velike/male črke?
  6. samo cela beseda?

Razlaga:

  • iskalni niz je pojem, ki naj ga OpenOffice poišče v besedilu. Primer: 11. septemb
  • prikaz je besedilo, ki se bo prikazalo v stvarnem in imenskem kazalu. Primer: 11. september 2001
  • 1. ključ in 2. ključ: stvarno in imensko kazalo ima lahko drevesno strukturo. Primer: v stvarnem kazalu je pojem teroristični napadi (prvi ključ), sledijo podpojmi napadi v ZDA, napadi v Evropi,... (drugi ključ), nato pa se prikaže tim. prikaz - 11. september 2001 in številke strani v besedilu, kjer se pojem pojavlja.
  • razlikuj velike/male črke?: možne vrednosti so 1 ali 0. Če želimo, da OpenOffice pri iskanju iskalnega niza upošteva velike in male črke, nastavimo na 1.
  • samo cela beseda?: možne vrednosti so 1 ali 0. Če želimo, da OpenOffice pri iskanju iskalnega niza upošteva celo besedo, nastavimo na 1, če pa želimo, da išče po korenu besede, nastavimo na 0.

Primer pripravljenih ključnih besed:

Ko smo s tem končali, vnešene pojme označimo in prekopiramo v urejevalnik besedil Gedit, ki ga najdemo v meniju Programi - Pripomočki - Urejevalnik besedil.

V urejevalniku besedil so pojmi v posamezni vrstici ločeni s tabulatorjem. Tabulatorje je potrebno zamenjati s podpičjem, kar storimo tako, da pritisnemo Ctrl-H in in vse tabulatorje (\t) zamenjamo s podpičjem (;):

Datoteko sedaj shranimo s končnico .sdi.

Gradnja kazala

V OpenOffice Word Processorju se pomaknemo na konec dokumenta in iz menija izberemo: Vstavi - Kazala vsebine - Kazala vsebine.

Izberemo Abecedno kazalo ter med možnostmi odkljukamo možnosti, ki jih želimo uporabiti (predlagam podoben izbor glede na spodnjo sliko):

Izberemo možnost Konkord. datoteka in .sdi datoteko odpremo ter jo uvozimo.

Z ostalimo možnostmi lahko določimo ali bo kazalo v enem ali več stolpcih, kakšno bo oblikovanje kazala, določimo lahko tudi format izpisa (ali se izpiše vsaka stran, kjer se nahaja pojem, ali se izpišejo strani v obliko xx-xx, itd.). S klikom na v redu se kazalo zgradi.

Urejanje in oblikovanje kazala ter izvoz v PDF

(v delu...)

 
kazalo_in_pdf.txt · Zadnjič spremenil/a: 2008/01/04 13:06 matthai
 
Recent changes RSS feed Creative Commons License Donate Powered by PHP Valid XHTML 1.0 Valid CSS Driven by DokuWiki