Dokumentumok konvertálása PHP-vel parancssorból. A feladat a következő:



Hasonló dokumentumok
Kedvenc Linkek a témakörben: MySQL mindenkinek Vizuális adatbázis tervezés

Parancssoros megoldások:

Smarty AJAX. Miért jó ez? Ha utálsz gépelni, akkor tudod. Milyen műveletet tudunk elvégezni velük:

Kedvenc Ingyenes editorok avagy milyen a programozó jobbkeze? PSPAD editor DEVPHP IDE

Válltáska Ubuntu 8.04 Hardy Heron. A Hardy Heron jelentését feszegető téma:

Miért jó ez: A Xampp csomag előnyös tulajdonságai: rendkívül jól felszerelt naprakész telepíteni-és frissíteni gyerekjáték.

Editor, IDE, Php, HTML, CSS, JS fejlesztéshez

Oktatási cloud használata

Delphi programozás I.

KnowledgeTree dokumentumkezelő rendszer

Operációs rendszerek gyak.

13. Fájlformátumok. Schulcz Róbert Madarassy László 13. Fájlformátumok v

A függvény kód szekvenciáját kapcsos zárójelek közt definiáljuk, a { } -ek közti részt a Bash héj kód blokknak (code block) nevezi.

LINUX PMB LINUXOS PARANCSOK ÉS HASZNÁLATUK - GRUB

Szavakon innen, Wordön túl

Az internet ökoszisztémája és evolúciója. Gyakorlat 1

Debian mint Desktop Operációs rendszer

XUBUNTU Linux (ami majdnem UBUNTU)

S z á m í t ó g é p e s a l a p i s m e r e t e k

A leírás bemutatja hogy mint minden másra, Favicon készítésre is alkalmas az ingyenes Gimp rajzolóprogram.

Youtube videó letöltés és konvertálás Linuxon

DocBook útmutató. Jeszenszky Péter Debreceni Egyetem, Informatikai Kar

ELTE SAP Excellence Center Oktatóanyag 1

Programozási nyelv Java

Operációs rendszerek. 4. gyakorlat. BASH bevezetés, script írása, futtatása UNIVERSITAS SCIENTIARUM SZEGEDIENSIS UNIVERSITY OF SZEGED

A Debian, mint Desktop Operációs Rendszer

AWK programozás, minták, vezérlési szerkezetek

Miért érdemes váltani, mikor ezeket más szoftverek is tudják?

AWK programozás, minták, vezérlési szerkezetek

2017/01/27 08:59 1/6 Gettext Rendszer

4. Laborgyakorlat. A fájlokról ezeket az adatokat, a fájlrendszer tárolja. Számunkra az 1, 3, 4. oszlopok lesznek az érdekesek.

Dokumentumformátumok Jelölő nyelvek XML XML. Sass Bálint Bevezetés a nyelvtechnológiába 2. gyakorlat szeptember 20.

PHP. Adatbázisok gyakorlat

Programzás I gyakorlat

Tudás Reflektor. Copyright 2011; Kodácsy Tamás;

Operációs rendszerek gyak.

II. Mérés SZÉCHENYI ISTVÁN EGYETEM GYŐR TÁVKÖZLÉSI TANSZÉK

A Clipper evolúciója

WINDOWS TELEPÍTÉSI ÉS AKTIVÁLÁSI ÚTMUTATÓ A FOTOBETYAR.HU - PHOTOSHOP PLUGINJEIHEZ

INFORMATIKAI ALAPISMERETEK

F-Spot Fotókezelő Gthumb képmegjelenítő ImgSeek Gimp

Az állományok kezelésére használt fontosabb parancsok

Az internet ökoszisztémája és evolúciója. Gyakorlat 1

Operációs rendszerek 2 1. óra: Linux alapok Ismétlés. Windisch Gergely félév

AWK programozás Bevezetés

Dr. Pál László, Sapientia EMTE, Csíkszereda WEB PROGRAMOZÁS 4.ELŐADÁS. Adatbázis alapú alkalmazások készítése PHP-ben

1. Alapok. #!/bin/bash

Web harvesztelés. Automatikus módszerekkel

Az R használata (tárgyalt R verzió: ) Jeszenszky Péter Debrecen Egyetem, Informatikai Kar jeszenszky.peter@inf.unideb.hu

Adatbázis Rendszerek II. 5. PLSQL Csomagok 16/1B IT MAN

MVC. Model View Controller

WEBFEJLESZTÉS 2. ADATBÁZIS-KEZELÉS, OSZTÁLYOK

Az iskolai rendszerű képzésben az összefüggő szakmai gyakorlat időtartama. 10. évfolyam Adatbázis- és szoftverfejlesztés gyakorlat 50 óra

Adatbázis és szoftverfejlesztés elmélet

PDF. Tartalomjegyzék 1/21

Operációs rendszerek. 11. gyakorlat. AWK - szintaxis, vezérlési szerkezetek UNIVERSITAS SCIENTIARUM SZEGEDIENSIS UNIVERSITY OF SZEGED

Szkriptnyelvek. 1. UNIX shell

Bevezetés a programozásba I.

KFKI Unified Messaging Server (UMS) Felhasználói Útmutató

Ismerkedés a Python programnyelvvel. és annak micropython változatával

Nyíregyházi Egyetem Matematika és Informatika Intézete. Fájl rendszer

A Számítógépes alapismeretek témakör oktatása. Dr. Nyéki Lajos 2019

Szoftver alapfogalmak

SZÁMÍTÓGÉPES ADATBÁZIS-KEZELÉS. A MySQL adatbáziskezelő PHP folytatás JDBC, ODBC

HORVÁTH ZSÓFIA 1. Beadandó feladat (HOZSAAI.ELTE) ápr 7. 8-as csoport

INFORMATIKAI ALAPISMERETEK

Bevezetés az informatikába, második gyakorlat. Bevezetés Környezetváltozók és néhány egyszerű utasítás Jogosultságok Fájlkezelés

Mértékegységek a számítástechnikában

A perzisztens adatkezelő rendszer tesztelése és demonstrálása a GRID környezetben

MŰSZAKI KÖVETELMÉNYEK, A KÖRKERESŐ SZOFTVER SPECIFIKÁCIÓJA, KÖLTSÉGVETÉS. A) Műszaki követelmények

Tájékoztató. Használható segédeszköz: -

Rendszerkövetelmények

A Cobra Sprint telepítése CobraContoLight felhasználók számára

PHP. Telepítése: Indítás/újraindítás/leállítás: Beállítások: A PHP nyelv

Web Application Attack and Audit Framework W3AF

Programozás I. gyakorlat

Munka a fájlokkal. Az általánosan használt fájltípusok. Programfájlok. Adatfájlok

Az Evolut Főkönyv program telepítési és beállítási útmutatója v2.0

Operációs rendszerek. 1. gyakorlat. Bevezetés, követelmények UNIVERSITAS SCIENTIARUM SZEGEDIENSIS UNIVERSITY OF SZEGED

3. modul - Szövegszerkesztés

PYTHON. Avagy hosszú az út a BioPythonig

1_Linux_bevezeto_bash

Operációs rendszerek 2 3. alkalom - Reguláris kifejezések, grep, sed. Windisch Gergely windisch.gergely@nik.uni-obuda.hu

Termékinformáció Adapter A: Video C: USB B: SVHS D: Jelzőlámpa az USB-porthoz csatlakoztatva világít

TERC V.I.P. hardverkulcs regisztráció

ORACLE. SYS: rendszergazda SCOTT: demonstrációs adatbázis, táblái: EMP (dolgozó), DEPT (osztály) "közönséges" felhasználók

Komputeralgebra Rendszerek

Megtanuljuk, hogyan lehet egy web-alkalmazással adatbázishoz csatlakozni Pontosan megnézzük a PHP lehetőségeit o MySQL-hez o Oracle-höz

Dropbox - online fájltárolás és megosztás

Programozás II gyakorlat. 7. Példák a polimorfizmus alkalmazásaira

A PHP nyelv alapjai. Web-Sky Consulting Kft Tóth Imre 2009

Gyakorlati vizsgatevékenység A

INFORMATIKAI ALAPISMERETEK

ÜGYVÉDI IRODA Telepítési útmutató

Infocentrum Számlázó hálózatos verzió + Firebird Adatbázismotor

Programozás. (GKxB_INTM021) Dr. Hatwágner F. Miklós május 6. Széchenyi István Egyetem, Gy r

Gimp mozaikszó a ( GNU Image Manipulation Program) szavakból származik. Platform: Linux, Unix, Windows, MacOSX

Programozás alapjai gyakorlat. 2. gyakorlat C alapok

Apache, MySQL, PHP/Perl NetWare-n

Átírás:

Dokumentumok konvertálása PHP-vel parancssorból. A feladat a következő: Konvertáljunk át n darab doc, rtf, pdf fájlt.txt szöveges formátumba, úgy hogy később kereshető, kategorizált, módosítható legyen a tartalma. Mindezt parancssoros eszközökkel úgy, hogy a kimenet akár webszerverről is működjön. A feladatot annyiban nehezítjük hogy csak ingyenes szoftvereket vehetünk igénybe. Kereshetőség: SQL adatbázisba tároljuk a szöveges állományt. Kategóriákba sorolás: szintén az adatbázis 1 mezőjével megoldva. Kimenetek: rendezett nevek eredeti fájl másolása, átnevezése.zip archívum elkészítése.txt fájl elkészítése adatok adatbázisba töltése Mivel a PHP egyben ütős parancssori programnyelvként is használható és a fent felsorolt dolgokat mind meglehet vele valósítani, (adatbázis elérés, fájl műveletek, külső függvények hívása) ezért ebben dolgozunk. A választott operációs rendszer Linux. Miért Linux? (Xubuntu 7.10) Mert a fájlok átalakításához egyszerűen lehet telepíteni az eszközöket (és tökéletes erre a célra is!), míg Windowsos rendszeren ez elég körülményes lehet, de megvalósítható. Windowson hogyan? Cygwin telepítésével és ezek beszerzésével:

Cygwin telepítésével és ezek beszerzésével: unrtf - ok abiword pdftohtml catdoc ok antiword ok Mit telepítettem? root ként feltettem az alábbi dolgokat: sudo apt-get install unrtf abiword pdftohtml catdoc antiword Megjegyzem a Linux számtalan lehetőséget kínál dokumentumok konvertálására és indexelésére. A apt-vel telepített eszközök fele is bőven sok lenne, de tesztelni szerettem volna a kimeneteket is. Tracker GUI-val ellátott fájl indexelő szoftver amely SQLite adatbázist használ. Hogyan oldható meg PHP-ben a külsős rendszer függvények hívása? A válasz az exec PHP függvényben van. Amely élles környezetben a legtöbb esetben nem elérhető, mivel a használata komoly fejfájást okozhat a rendszergazdáknak. (igazuk van. De nem úgy a localhostra telepített szervernél, ahol minden lehet mint a búcsúban. Exec függvényről: //exec ( parancs, visszatérési érték tömb formájában, a futtatott parancs állapota ); $parancs=(string) echo hello világ ; $tomb=array(); $return=(int)0 exec ( $parancs, $tomb, $return);?> A tömb visszatérési érték ($tomb) minden eleme a kimenet 1 sora. Vagyis a $tomb[0]=kimenet 1 sora.

Vagyis a $tomb[0]=kimenet 1 sora. A tömb nem tartalmazza a sorvég karaktereket. Ha a tömböt nem töröljük a parancs végrahajtása előtt, akkor a következő futtatás a tömb végére lesz beszúrva. $return visszatérési érték tartalmazza a futtatott parancs állapotát. $parancs ez tartalmazza a parancssoron futtatni kívánt kódot (utasítást) pl. unrtf msdoksi.rtf > /var/www/msdoksi.txt AbiWord-ről Aki ismeri ezt a profi, ingyenes, kis erőforrás igényű, ám de nagy teljesítményű szövegszerkesztőt annak nem kell bemutatni a tudását. Aki nem ismeri annak csak javasolni tudom, hogy próbálja ki. Tehát az AbiWord nevű parancssorból is elérhető eszközzel remekül tudunk dokumentum formátumokból konvertálni. A lenti példa jól mutatja, hogy amilyen formátumokat kezel az AbiWord. A kimenetre is hasonlót tudunk gyártani vele (abw, zabw, rtf, txt, utf8, html, latex ). Íme néhány példa, hogy mennyire egyszerű: 1. $ abiword to=formátum fajlneve.kiterjesztes 2. $ abiword to=/var/www/a_html_kimenet.html msdoksi.rtf AbiWord opciók: 1. geometry=geometry_string Sets the initial frame geometry. X11-like geometry string. 2. nosplash Do not show the splash screen 3. to=format or FILENAME Target format of file or new target filename. For conversion AbiWord documents. [abw, zabw, rtf, txt, utf8, html, latex,etc] 4. verbose Specify the amount required amount of detail of the message information. 5. plugin=plugin_name Execute plugin instead of the main application 6. print=file or lpr Print any documents passed on the command line to FILE or send the output to the specified print command 7. show Force the Graphical User Interface (GUI) to be shown, even if using the options to or help 8. version Report the version of AbiWord. 9. help Displays a helpful message explaining AbiWord usage CatDoc megközelítés: (V.B.Wagner) A catdoc segítségével MS-Word fájlokból.txt fájlt gyárthatunk. Ami a legjobb hogy megadhatjuk a kimenet karakterkódolását is. MAN catdoc. Elvileg tud HTML kimenetet is, de a fejléc részét rendesen megpakolják a programról szóló információkkal (Ez általában igaz mindegyikre, sajna). catdoc -s cp1252 -d cp1252 msdoc.doc > /var/www/t.txt UnRtf (GNU UnRTF 0.19.2) Ms-Word formátumból konvertálunk: Az UnRtf programmal RTF formátumban lévő dokumentumokat tudunk kovertálni html, text, vt (VT100 escape codes), latex, ps (PostScript output), wpml kimenetté. 1. unrtf ms_doksi.rtf > /var/www/doksi.txt 2. unrtf text ms_doksi.rtf > /var/www/doksi.txt Utasítás felépítése és opciók: unrtf [options] [file...] Options: [--nopict] [--html] [--text] [--vt] [--latex] [--ps] [--wpml][--help] [--version] A legjobb text kimenetet MS-WORD fájlból az AntiWord nevű programmal értem el:

A legjobb text kimenetet MS-WORD fájlból az AntiWord nevű programmal értem el: 1. antiword -m 8859-2.txt ms_doksi.doc > doksi.txt Pdf-ből.txt átalakítás: Két lépcsőben sikerült megoldani a dolgot úgy, hogy ne keljen vele vacakolni sokat. Pdftohtml programmal készítettem egy.html fájlt a.pdf-ből (frame-nélkül), és a kimenetet átadtam az abiword-nek ami.html-ből már tud dolgozni (pluginek nélkül is). 1. pdftohtml -noframes /var/www/test.pdf /var/www/test.html 2. abiword to=/var/www/test.txt /var/www/test.html Pdftohtml was developed by Gueorgui Ovtcharov and Rainer Dorsch. Pdf fájlokból konvertál html, xml formátumba + a képfájlokat is megkapjuk az eredeti állományból. A pdftohtml nagyon jól paraméterezhető, de a html tartalmat szintén teli cuccolja sajátos információkkal (amit megjegyzem nem volna nehéz eltávolítani, de minek). Beállíthatjuk melyik oldaltól kezdje az átalakítást, hol fejezze be. Alapjáraton a szoftver egy frames html oldalat készít bármely PDF dosikból, ahol a linkek, könyvjelzők is a helyükön vannak. PHP használata Linuxon parancssoros eszközként: /var/www/test_sh.php tartalma: #! /usr/bin/php echo hello világ ; //újsor karakter /n?> A fájl legyen futtatható. Bár a fájlt a /var/www/ mappába mentettem ne tévesszen meg senkit, de nem böngészőből lesz futtatva, hanem parancssorból. A fordító helyét mutatja a #! /usr/bin/php string. A fájl futtatása konzol módban: /var/www/test_sh.php ha mögé írunk agy & karaktert akkor háttérben futó folyamat lesz../var/www/test_sh.php & Ami a PHP programozást illeti az a szokványos módon mehet a fájlban. Annyi különbséggel hogy a programozás során az EXEC PHP függvény segítségével (ha engedélyezve van) külső Linuxos programokat is hívhatunk, feldolgozhatunk. A PHP programnyelvet nem csak szerveroldali programozásra lehet használni, hanem parancssori programnyelvként is. Ezért aki ismeri a PHP programnyelvet, az Linuxon rendszeren sincs elveszve. Pingvinre fel!

Teszt alkalmazás itt található. nincs kapcsolódó bejegyzés. Téma: Webalkalmazás fejlesztés Forrás: http://opendir.hu Szerző: ArtH2O Erdeti URL: http://opendir.hu/webalkalmazas/php/238-php-mint-parancssoros-programnyelv/