Commit d87a0e48 authored by Sidorela Uku's avatar Sidorela Uku

Update shtojca_3.rst

parent b7a0f5d2
Pipeline #230 failed with stages
in 1 minute and 9 seconds
......@@ -44,7 +44,7 @@ d) Nga një sistem apo paketë ekzistuese
a) Fillimi nga një publikim ekzistues
-----------------
~~~~~~~~~~
Në këtë skenar, ne fillojmë nga një proces ekzistues në tv cilin të dhënat janë mbledhur dhe procesuar përpara se të përfshihen në publikim. Mendoni për të gjitha publikimet e vëna në dispozicion nga sektori publik dhe sasinë e të dhënave të gjeneruara. Të dhënat janë rezultat i një numri fazash të procesit të cilat janë kryer nga një ose më shumë administrata.
......@@ -78,7 +78,7 @@ Sapo të dhënat janë gati për t'u publikuar si të Dhëna të Hapura, mbeten
* Sigurimi i përditësimeve të herëpashershme
b) Fillimi nga një dataset ekzistues
-----------------
~~~~~~~~~~
Shumë organizata aktualisht publikojnë një sasi të konsiderueshme informacionesh në uebfaqe në një format të hapur dhe të shkarkueshëm, formate si CSV (shënim: nëse të dhënat janë në formate të mbyllura (p.sh PDF, XLS,) shikoni skenarin 1). Ne supozojmë se organizata do vazhdojë t'i ofrojë informacionet nëpërmet shkarkimit apo shikimeve dhe të Dhënat e Hapura janë një kanal shtesë për t'i publikuar këto informacione. Kjo do të thotë se procesi themelor do vazhdojë të ekzistojë dhe do i shtohet një hap shtesë. Zakonisht, të dhënat publike nuk përputhen plotësisht me kriteret e të Dhënave të Hapura. Me përkushim minimal dhe hapat shtesë, kjo mund të provojë një bazë të solide për t'i kthyer ato në të Dhëna të Hapura.
......@@ -105,7 +105,7 @@ Hapat në vijim janë gjithmonë të nevojshme në këtë skenar, sapo të krijo
* Sigurimi i përditësimeve të herëpashershme
c) Fillimi nga një bazë të dhënash
-----------------
~~~~~~~~~~
Në shumë raste, të dhënat bazë janë përfshirë në një bazë të dhëash të krijuar për një aplikacion për të mbështetur procesin e një biznesi për organizatën e sektorit publik. Kjo është gjithashtu pika fillestare në këtë skenar: ekstraktimi i të dhënave nga një bazë të dhënash dhe transformimi i tyre në një varg të Dhënash të Hapura.
......@@ -120,7 +120,7 @@ Supozimi në këtë skenar është që ne kemi një aplikacion i cili është zh
Një shënim për tu bërë në këtë kontekst është se ne nuk i barazojmë këtë lloj operacioni 'teknik' me operacionet 'lidhur me përmbajtjen' të cilat zakonisht zënë vend gjatë hapit të 'transformimit'. Ne i referohemi transformimeve komplekse (p.sh lidhja e regjistrimeve të njëpasnjëshme nga nxënës të sistemeve të ndryshme me njëri-tjetrin (i ulët, sekondar, i lartë, VDAB, etj)) për të ndërtuar një karrierë të tërë studimi). Kjo mund të kërkojë një ose më shumë hapa teknikë. Ne propozojmë hapat në vijim:
Hartëzimi
~~~~~~~~~~
-----------------
Si fillim, krijoni një hartë logjike të të dhënave në të cilën lidhjet fizike të bazës së të dhënat janë injoruar më së shumti. Rezultati është se një ekstrakt nga baza e të dhënave pothuajse asnjëherë nuk do publikohet direkt si të Dhëna të Hapura. Megjithatë, është e mundur. Në shumë raste, do të ishte e pamundur të publikohet një kopje një-më-një dhe hapat duhet të ndërmeren për të transformuar kopjen e bazës së të dhënave në një format të vetëm (për shembull, duke zëvendësuar çelësat me vlerat, vendosja e referencave, të bëhen referencat konsistente, etj). Për më tepër, hapat janë të nevojshëm për të kombinuar tabelat me njëra-tjetrvn derisa të arrini në një hartë të dhënash logjike. Teknologjia e transformimeve mund të përdoret dhe për të përshtatur të dhënat.
......@@ -128,7 +128,7 @@ Si fillim, krijoni një hartë logjike të të dhënave në të cilën lidhjet f
:alt: The ETP-Process starting from an existing database
Ekstraktimi
~~~~~~~~~~
-----------------
Pjesa më e sistemeve të databazave kanë teknika standarde për të lexuar tabelat dhe për t'i bërë ato të disponueshme si skedarë të sheshtë. Për shembull:
......@@ -145,13 +145,13 @@ ODBC (apo direct SQL, e cila është në fakt e njëjta gjë) do ju lejojë prog
Transformimi
~~~~~~~~~~
-----------------
Kjo përfshin një kontroll të plotë të cilësisë së të dhënave, si në rastin e cdo mjedisi për depozitimin et ë dhënave. Për shembull, përdorimi i emrave uniformë për fushat dhe përmbajtjen në vend të shkurtesave të fshehura, mospërdorimi i 0 dhe 1 për gjininë por M = Mashkull, ruajtja e adresës është gjithashtu një mënyrë e qëndrueshme, shkrimi i emrave të plotë dhe me të njëjtin format, etj. Për shkak se nuk mund të supozojmë se ështv vendosur paraprakisht një proces, të gjitha këto hapa transformimi duhet të kryhen. Në këtë fazë, përmbajtja gjithashtu mund të procesohet si anonimizimi i të dhënave apo kombinim i dataseteve për të arritur gjendje uniforme. Preferohet që të dhënat e ekstraktuara të eksportohen sa më shpejt dhe shpesh të jetë e mundur për të lejuar përdoruesit e të Dhënave të Hapura dhe qytetarët të kenë referencën e fundit në dispozicion, sidomos kur ka të bëjë me ndryshimin e shpejtë të të dhënave. Si pasojë, është e rëndësishme që transformimet që këto të dhëna pësojnë janë të riprodhueshme dhe preferohen të ndodhin automatikisht.
Publiko
~~~~~~~~~~
-----------------
Hapat në vijim janë gjithmonë të nevojshme në këtë skenar, sapo të krijohet dataseti.
......@@ -164,7 +164,7 @@ Hapat në vijim janë gjithmonë të nevojshme në këtë skenar, sapo të krijo
d) Fillimi nga një sistem burimor ekzistues
-----------------
~~~~~~~~~~
Pika e nisjes në këtë skenar është sektori publik i cili ka një apo më shumë sisteme apo paketa operacionale nga ku mund të meren të Dhëna të Hapura, me kusht që një numër operacionesh të kryen, me apo pa ndërhyrjen nga furnizuesi apo ofruesi i shërbimit i cili menaxhon paketat që kanë lidhje me organizatën e sektorit publik. Në këtë skenar, kompleksiteti shtesë është që një paketë nuk është e përfshirë dhe mund të mos lejojë akses direkt tek baza e të dhënave.
......@@ -210,7 +210,7 @@ Hapat në vijim janë gjithmonë të nevojshme në këtë skenar, sapo të krijo
e) Fillimi nga burime të ndryshme - konsolidimi i të dhënave
-----------------
~~~~~~~~~~
Ky është skenari për organet me eksperiencë të përfshira në Inteligjencën e Biznesit dhe teknikat e depozitimit të të dhënave. Pritet që organizata e sektorit publik të ketë tashmë disa të dhëna të depozituara dhe mjediset e raportimit dhe të ketë eksperiencë në ekspozimin e të dhënave nga burime të ndryshme. Të gjitha teknikat dhe mjetet 'Extract' dhe ' Transform' janë tashmë në përdorim dhe mund të ri-përdoren këtu. Të dhënat e publikuar në një depozitë të dhënash janë zakonisht rezultat i një seri veprimesh, në sensin e përmbajtjes dhe grumbullimit. Së pari, nxirren të dhënat e përshtatshme nga burime të ndryshme dhe janë ruajtur vazhdimisht në mjedisin e Ruajtjes së të Dhënave Operacionale (ODS - Operational Data Store). Për të Dhënat e Hapura, kjo ka avantazhin që të dhënat nuk kanë më nevojë të ekstraktohen më vete nga sistemi burimor. Një ODS vshtë gjithahstu dhe forma më e ulët e detajimit të të dhënave, dhe prandaj është dhe një burim ideal për t'i hapur këtu të dhënat. Pas kësaj, të dhënat procesohen në faza dhe ruhen ndërkohë në tavolinat e organizimit. Disa programe veprojnë mbi këto për ti agreguar më tepër tv dhvnat dhe për t'i bërë ato të qëndrueshme përpara se të ndarkohen në një depozitë të dhënash. Për të Dhënat e Hapura ne gjithashtu mund të fillojmë nga një tavolinë organizimi nga ku vargu i të Dhënave të Hapura mund të prodhohet. Avantazhi i madh në këtë rast ështëse të gjitha korrektimet dhe veprimet në të dhënat janë të vendosura tashmë.
......
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment