Scan û OCR

Good afternoon

Heke ji me re pêdivî ye ku belgeya belgeyê bi forma elektronîkî wergera wergera we bi karê xwe re rû bi rûyê xwe re hat. Ev bi taybetî ji bo kesên ku dixebite, pêwîstî bi belgeyên xebatê, nivîsgehên wergeran bi karûbarên elektronîk, etc.

Di vê gotarê de ez dixwazim hin hinek bingehên vê pêvajoyê parve bikin. Di gelemperî de, hesab û nivîsandina nasnameyê pir carî ye, ji ber ku piraniya operasyon dê bi dest bi rêve kirin. Em ê hewl bikin ku bizanin ka çi, çawa û çima.

Ne her kes yekser tiştek fêm dike. Piştî scanning (hemî çarçikên li ser scanner derxistin), hûn wêneyên xwe yên BMP, JPG, PNG, GIF (hebin dikarin formên din jî bibin). Ji vî awayî ji vê wêneyê re hewce ye ku teksta xwe bibînin - ev pêvajoyê tê naskirin. Di vê yekê de, û dê jêrîn pêşniyar bikin.

Naverokê

  • 1. Ji bo scanning û naskirin çi ye?
  • 2. Vebijêrkên scanning nivîsandinê
  • 3. Têgihîştina nivîsê ya belgeyê
    • 3.1 Text
    • 3.2 Wêne
    • 3.3 Tables
    • 3.4 Nîşaneyên Nenas
  • 4. Fêmkirina pelên PDF / DJVU
  • 5. Çewtiya lêgerîn û encamên xebatên rizgarkirin

1. Ji bo scanning û naskirin çi ye?

1) Scanner

Ji bo dokumentên çapkirî yên nivîskî nivîskî, divê hûn pêşî şanekek hewce ne û li gor bernameyên "niştecîh" û ajokarên ku bi wê re çû. Bi wan re hûn dikarin belgeyê dakêşin û ji bo pêvajoya din biparêzin.

Hûn dikarin analogên din bikar bînin, lê pirtûkxaneyê ku bi scan di kitêbê de bi gelemperî zûtir dixebite û alternatîfên din hene.

Li ser ku tu çiqas scanner heye, li gor girêdayî karê lezgîn dikare girîng e. Scanners hene ku dikarin ji 10 saetan di wêneyê de wêneyê bibînin, hene ku ew di 30 saetan de bibin. Heke hûn pirtûka 200-300 pirtûka xwe bibînin - Ez difikirim ew e ku zehmet e ku çiqas wê di demekê de cûda heye?

2) Programa ji bo naskirinê

Di gotara me de, ez ê di bernameyek çêtirîn bernameyên ji bo scanning û hemî belgeyên nasnameyê de kar bikim - ABBYY FineReader. Ji ber bernameya pere tê dayîn, wê gavê ez ê bi hev re din re bertekim - nimûneya azad ya Cunei. Ya rastî, ez ji wan re nirx nakim, ji ber vê yekê rastiya ku FineReader di hemû rûmetan de, ez pêşniyaz dike ku hemî heman yekê hewl bikim.

ABBYY FineReader 11

Malpera fermî: //www.abbyy.ru/

Yek ji bernameyên çêtirîn ên xwe yên xwe. Ew tête çêkirin ku ji bo tekstê li wêneyê nas bike. Gelek bijartan û taybetmendiyê ava kirin. Ew dikare qonaxên fontsê jî parîs bikin, her weha pirtûkên destûra destûra piştgirî dike (tevî ku min kesek hewl didin wî nekiriye, ez difikirim ku hûn nebêjin ku hûn nehêlin ku versa nivîskî destnîşankirin heta ku hûn destûra guhartina paqijî ya başîn). Agahiya bêtir agahdarî li ser xebata wê dê dê li ser binivîse. Em jî li vir binivîse ku gotara gotara di xebitandinê de di bernameyên 11-ê de dixebite.

Wekî ku desthilatdar, guhertoyên cuda yên ABBYY FineReader ne ji hev hev cuda ne. Hûn dikarin bi hêsanî di heman din de bikin. Hûrgelên sereke dikarin di hêsanî, lezgîn a bernameyê û aborî de bibin. Ji bo nimûne, versiyonên berê berê belgeya pelê PDF vekin û DJVU ...

3) Dokumentên ji bo scan

Erê, lewma vir, min biryar da ku da ku belgeyên di çarçoveya cuda de derxistin. Di piraniya rewşan de, pirtûkxane, rojnameyan, gotar, kovaran, etc. Ew pirtûk û edebî ku daxwazek e. Ez çi im? Ji ezmûnek şexsî, ez dikarim bibêjim ku tu dixwazî ​​scan bixwaze - dibe ku li ser neteweyî be! Min çend caran dema ku ez pirtûka yek an jî li ser networkê din şehîd dîtiye çend caran carî kir. Min tenê hebû ku tekstê belgeya belgeyê bikim û bi wê re berdewam bike.

Ji vê şêwirdariya hêsan - ji ber ku hûn tiştek dakêşin, kontrol bikin ka kesek berê xwe dakêşand û hûn hewce ne ku hûn wextê xwe winda bikin.

2. Vebijêrkên scanning nivîsandinê

Li vir, ez ê ajokarên xwe ji bo scanner-ê, ku bernameyên wê çêdibe biaxivim, çimkî modelên hemî scanner-ê cuda cuda ye, nivîsbar li her derfetên cuda cuda ye û texmîn dike û hîn jî bêtir eşkere diyar dike ka operasyona ku çawa çawa didin operasyonek ne rast e.

Lê hemî scanners heman paceyê hene ku dikarin kar û kalîteya karê xwe bandor bikin. Li ser wan, ez ê li vir dipeyivim. Ez ê di lîsteyê de lîsteyê bikim.

1) Kalîteya Scan - DPI

Pêşîn, kalîteya skanek di alternatîfên 300 dpî de ne kêm e. Pêwîste ku ew gengaz e ku bêtir piçûktir dike. Ya bilind ya nîşana DPI e, wêneyê te paqij e, û wusa, dê pêvajoyê bêtir zûtir be. Herweha, bilindtirîn kalîteya scan-paşê kêm kêm ku we paşê we heye.

Bijare herî baş, piranî 300-400 DPI.

2) xemgîniyê

Ev parameter pir bandora scan gelek bandor dike (bi rêya awayî, DPI jî bandor dike, lê ew ewqas bihêz e, û tenê dema ku bikarhênerên nirxên bilind dike).

Bi gelemperî sê modes hene:

- black and white (perfect text for plain);

- gray (ji bo nivîsê bi tables û wêneyên bêtir);

rengê (kovara rengan, kitêba, di gelemperî, belgeyên ku rengê girîng e).

Bi gelemperî scan di hilbijartina rengê de girêdayî ye. Wekî din, heke we belgeyeke we heye, heta 5-10 çiravên din jî li ser rûpelê dê dê di demeke baş de encam bikin ...

3) Wêne

Hûn dikarin belge bi tenê bi scanning, lê belê bi wêneyê vê yekê bigirin. Wekî ku hukûmetê, di vê rewşê de hûn pirsgirêkên din hene. Ji ber vê yekê, dibe ku bêtir guherîn û pêvajoyê ya teksta wergirtî heye. Bi taybetî, ez ji bo karsazên karanîna vê karsaziyê pêşniyar dikin.

Pêdivî ye ku girîng bikin ku her belge belgeyên naskirî ne, çimkî kalîteya skan he dikare pir kêm e ...

3. Têgihîştina nivîsê ya belgeyê

Em difikirin ku pirtûkên ku hûn tezmînatê hatine qeyd kirin. Pir caran ew forman in: tif, bmb, jpg, png. Di gelemperî de, ji bo ABBYY FineReader - ev pir girîng e ...

Piştî vekirina wêneyê li ABBYY FineReader, bernameyek, wek desthilatdar, li ser pizik dest pê dike ku herêmên hilbijêrî û wan nas bikin. Lê carinan ew ew çewt e. Ji bo vê yekê em hilbijartina hilbijartinên desthilatdariyê bi awayekî xwe bifikirin.

Ew girîng e! Ne her kes zû dizanin ku piştî belgeya belgeyê di bernameya vekirina veguhestinê de, belgeya çavkaniyê li milê çepê, ku hûn li herêmên cuda cuda dikin. Piştî doktorê "nasnameya" bitikîne, bernameyek li pencereyê rastê dê te binivîse nivîsîn. Piştî nasnameyê, bi rêya awayê, ew pêşniyar dike ku tekstên çewtiyê li heman heman FineReader kontrol bikin.

3.1 Text

Ev herêm tê bikaranîn ku tête nivîsandinê. Divê wêneyan û maselan ji vê derê ve bêne rakirin. Fonksiyonên rêjeyên nermal û unusual wê bi dest bi destnîşan kirin ...

Ji bo qada tekstê hilbijêre, li pela li ser FineReader bikişînin. Vebijêre "T" ye (li vir bibîne. Binivîse klavyoya jêrîn, bişkojka mîkrokê tenê li vê vê buttonê ye). Li ser vê yekê bike, paşê li li wêneyê jêrîn li herêmê ye ku li qada nivîskî rectangular ne hilbijartî hilbijêre. Bi awayê, di hinek rewşan de hewce ne ku hûn blokên 2-3, û carinan hinek 10-12 rûpelan ava bikin, ji ber ku Formatting Text cuda dibe û tevahiya heremê bi yek re reklaman hilbijêre.

Pêdivî ye ku girîng be ku wêne divê li herêmê qonax nekin! Di pêşerojê de, ew ê ji we re gelek caran diparêze ...

3.2 Wêne

Bikaranîna wêneyên jimar û wan deverên ku dijwar ne ji ber ku ji hêla kalîteya neqfayî an jî nimûnî ya nexşandî tê bikaranîn.

Di binê klavyoyê de, poztera mîksê li ser lêgerînê ye ku ji bo hilbijêre "wêne" hilbijêrin. Bi awayê, tevahî beşek rûpelê dikare li vê herêmê bijartin, û FineReader dê wê di nav belgeya asayî de wekî belgeyê bişîne. Ie tenê "stupid" wê kopî bike ...

Bi gelemperî, ev qada tê bikaranîn ku tehlên şehrezayî yên berbiçav berbiçav bikin, da ku ji xwe re wêneyên nivîskî û nivîsa ne-standard nîşan bide.

3.3 Tables

Li jêr klavyoyên jêrîn bişkojka xalên tehlikê nîşan dide. Di gelemperî de, ez bixweber bixwe jî pir kêm e. Rast rast e ku hûn bi xwe bi awayek bi rastî (herdu) her line li ser sifrê dikişînin û nîşan bide ka çi û çawa bernameyê. Ger maseya piçûk e û ne qalîteya baş baş e, ez ji bo armancên "picture" bikar tînin pêşniyaz dikin. Bi vî awayî gelemperî xelas bike, û hingê hûn bi zûtirîn li Wordê li ser bingeha wêneyê.

3.4 Nîşaneyên Nenas

Pêdivî ye ku girîng be. Gelek hûrgelên hûrgel hene ku li ser rûpelê ku dijwariya nivîskî nas dikin, an jî hûn nehêle ku hûn li her tiştî bixwazin herêmê hilbijêrin. Ew dikarin bikaribin bi "eraser" bikar bînin.

Ji bo vê yekê, diçe modela guherînê de herin.

Vebijêrîna eraser hilbijêre û qadên bêkariyê hilbijêre. Ew dê jêbirin û di cîhê wê dê pelê spî be.

Bi awayê min, ez ji bo ku hûn mimkun bi mimkun bi we re bijare pêşniyar dikin. Hemû hewceyên ku hûn hilbijartin, hewce bikin ku hewce ne parçeyek tekstê hewce ne, an jî xalên ku hewce ne, hûrgelan, xemgîniyê - bi jêbirinê jêbirin. Ji kerema xwe ev nasnameyê zûtir be!

4. Fêmkirina pelên PDF / DJVU

Di gelemperî de, ev formatê dê ji yên din cuda cuda ne - e. Hûn dikarin bi tenê wêneyên bi wêneyên kar bikin. Tenê tiştê ku bernameyê bernameya pir kevin ne, heke hûn pelên PDF / DJVU vekirî ne - guhertoya 11 anîn.

Hinek şêwirdariyek piçûk Piştî dokumenta vekirinê ya li FineReader - ew ê di destpêkê de belgeya nasnameyê nas bike. Pir caran di pelên PDF / DJVU de, di qada taybet a rûpelê de di tevahiya pelan de ne hewce ye. Ji bo ku hûn li ser hemû rûpelan derxînin, jêrîn bikin:

1. Biçe beşa beşa wêneya wêneyê.

2. Vebijêrk "trimming" hilbijêre.

3. Li herêmê ku hûn li ser hemû rûpelan hilbijêre hilbijêrin.

4. Li ser hemû rûpelan û trim serlêdan bikî hilbijêre.

5. Çewtiya lêgerîn û encamên xebatên rizgarkirin

Wê dixuye ku hîn hîn pirsgirêkan dibe ku pirsgirêkên her deveran hatine hilbijartin, wê demê nas kirin - wê bistînin û ew xilas bike ... Ew nebû!

Pêşîn, em hewce ne ku belgeyê kontrol bikin!

Ji bo ku çalak bikin, piştî ku naskirî, di pencereya rastê de, dê dê "check" binêrin, li binê vîzîkoya jêrîn bibînin. Piştî ku wê binivîse, bernameya FineReader ê bixweberên ku hûn bernameyên çewt hene û wê bi awayekî yek bi sembola din diyar bike. Hûn dê tenê tenê hilbijêrin, an jî hûn bi ramanên bernameyê re bipejirînin, an jî keserek xwe binivîse.

Bi awayê, di nîv dozan de, nêzîkî bernameyê we ji we re peyva rastek amade kir ku peyva rast-amade ye.

Ya duyemîn, piştî kontrolkirina we hewce ye ku ji bo ku hûn encama xebata xwe rizgar bikin, hilbijêrin.

Li vir FineReader ji we re bi awayek tewra xwe dide: "Hûn dikarin bi agahdariya bi Word-on-one veguherînin, û hûn dikarin di nav dehan ji forman de bigirin. Lê ez dixwazim pêşniyazek din girîng bikim. Heke ku hûn hilbijêre, bijare girîng e ku ji kopê hilbijêre! Vebijêrkên herî balkêş binêrin ...

Copy copy

Hemî qadên ku hûn li ser pirtûkê di belgeya naskirî de hilbijartin dê di belgeya çavkaniyê de bi hev re bihev bikin. Ya ku hûn ji bo ku hûn ne girîng e ku bijartina teknolojiyê winda ye. Bi awayê, fonts dê pir bi heman rengî be. Ez ji vê bijareyê pêşniyar dikim ku belgeyê belgeya Wordê veguherînim, da ku li wir derê berdewam bikin.

Copy copyable

Vebijêrk baş e ji ber ku hûn guhertoya nû ya nivîskî ya nû çêkirî ye. Ie Indentation of "kilometer", ku dibe ku di belgeya eslî de hebe - hûn ê nabêjin. Dema ku hûn bi girîngî agahdariyê biguhînin bijare.

Tiştek, divê hûn ne hilbijartin heger hûn ji bo ku hûn şêwirmendiya design, fonts, indên parastin girîng e. Gelek caran, heger nasnameya pir serkeftî ne - belgeya we dikare ji ber hilberandina guhertina guhertinê "dibe". Di vê rewşê de, ew şêwirmend e ku kopiyek rastîn hilbijêrin.

Tekstê

Vebijêrk ji bo kesên ku tenê tekstê ji rûpelê hewceyê bêyî hewceyê bêyî her tiştek din. Ji belge û wêneyên bêyî belgeyên baş in.

Ev gotara belge û nivîsandinê belgeyê dike. Ez hêvî dikim ku alîkariyên ji van pêşniyarên hêsan ên ku hûn dikarin pirsgirêkên xwe çareser bikin ...

Xwezî!