Inom databehandling är data information översatt till ett format som är effektivt för överföring eller bearbetning. I dagens datorer och överföringsmedier innebär data information som omvandlats till binärt digitalt format. Data kan användas som både ett singular- och pluralord. Begreppet ”rådata” beskriver data i dess mest grundläggande digitala form.
Data inom databehandling har sitt ursprung i arbetet av Claude Shannon, en amerikansk matematiker känd som informationsteorins fader. Han introducerade binära digitala koncept baserade på tvåvärdes Boolean-logik som tillämpades på elektroniska kretsar. Binära format ligger till grund för processorer (CPU), halvledarminnen och hårddiskar, samt många kringutrustningar som används i modern databehandling. Tidiga datorinmatningar för kontroll och data gjordes genom stansade kort, följt av magnetband och hårddiskar.
I affärsvärlden blev datas betydelse tydlig tidigt genom termer som databehandling och elektronisk databehandling, vilket under en tid täckte in det som idag kallas informationsteknologi. Under utvecklingen av företagsdatabehandling specialiserades yrkesområdet och en särskild dataproffession växte fram tillsammans med den ökande användningen av företagsdatabehandling.
Hur lagras data?
Datorer representerar data, inklusive video, bilder, ljud och text, som binära värden genom mönster av två siffror: 1 och 0. En bit är den minsta enheten av data och representerar ett enda värde. En byte består av åtta binära siffror. Lagring och minne mäts i megabyte och gigabyte.
Dataenheterna har ökat i takt med att mängden insamlad och lagrad data växt. Till exempel är en brontobyte en datalagringsenhet motsvarande 10 upphöjt till 27 byte.
Data lagras i olika filformat, exempelvis ISAM och VSAM på mainframesystem. Andra format, som kommaseparerade värden (CSV), används för datalagring, konvertering och bearbetning och finns på många olika typer av maskiner, även när mer strukturerade datalagringsmetoder fick fäste i företagsmiljöer.
Med tiden utvecklades specialiseringar inom datahantering genom uppkomsten av databaser, databashanteringssystem (DBMS) och relationell databas-teknologi för att organisera information.
Typer av data
Tillväxten av internet och smartphones under de senaste två decennierna har lett till en enorm ökning av digital dataskapande. Data inkluderar nu stora mängder ostrukturerad information som text, ljud, video samt loggar och webbaktivitetsregister. Generativ AI kan också skapa syntetisk data. Artificiella datamängder används för att träna AI- och maskininlärningsmodeller, mjukvarutestning och prediktiv modellering.
Begreppet ”big data” beskriver data i petabyte-storlek eller större. En kort sammanfattning av big data omfattar de fem V– värde, volym, variation, verifikation och hastighet. I takt med att e-handel över webben ökade, utvecklades big data-drivna affärsmodeller som behandlade data som en värdefull tillgång. Denna trend skapade ett ökat fokus på dataintegritet och dataskydd.
Data har en vidare betydelse än inom databehandling och dataprocessering. Till exempel används termen data ofta för att skilja huvudinformationen i en överföringsenhet från kontrollinformation eller kontrollbitar. Inom vetenskapen beskriver data en samlad mängd fakta, vilket också gäller för områden som finans, marknadsföring, demografi och hälsa.
Datahantering och användning
Ökningen av data i organisationer innebär att kvalitetssäkring av data blir allt viktigare. Detta inkluderar att minska duplicering och säkerställa att den mest korrekta och aktuella informationen används. Modern datahantering innefattar flera steg, inklusive datarensning samt extrahering, transformering och laddning (ETL) för att integrera data. Metadata, ibland kallad ”data om data,” kompletterar data för bearbetning. Metadata hjälper administratörer och användare att förstå databaser och annan data.
Framsteg inom analys gör det möjligt att kombinera strukturerad och ostrukturerad data. Målet är ofta realtidsbearbetning, som kan hantera inkommande data i höga hastigheter och bearbeta datastreams för omedelbar användning i operationer.
Begreppet databaser för operationer och transaktioner utvidgas till att omfatta databaser för rapportering och prediktiv dataanalys. Ett exempel är datalager, som är optimerade för att bearbeta frågor om verksamheten för affärsanalytiker och företagsledare. Den ökande betydelsen av att hitta mönster och förutse affärsresultat har lett till utvecklingen av datamining-tekniker.
Dataproffs
Yrket som databasadministratör har växt fram som en specialisering inom IT. Som experter på databaser designar, optimerar och underhåller administratörer databaser.
Datahanteringsyrket växte fram i takt med att relationella databashanteringssystem (RDBMS) blev vanligt i företag på 1980-talet. Relationella databaser möjliggjordes delvis av strukturerat frågespråk (SQL). Senare dök NoSQL-databaser upp som ett alternativ till de etablerade RDBMS.
Företag anställer datahanteringsexperter eller ger vissa anställda ansvar för dataskydd, vilket innebär att följa policys för dataanvändning och säkerhet enligt principerna i datastyrning.
En särskild titel – datavetare (data scientist) – beskriver yrkespersoner som fokuserar på datamining och analys. Fördelen med att framställa dataanalys på ett inspirerande sätt har även lett till rollen som dataartist, en person skicklig i att grafiskt och visuellt presentera data på kreativa sätt.
Dataingenjörer samlar in och förbereder data för datavetare och analytiker. Ingenjörer behöver ha kunskap om hur man arbetar med både strukturerad och ostrukturerad data från olika källor för att skapa en datamängd av hög kvalitet. Dataarkitekter skapar ramverket för datahanteringsverksamheten. De definierar policys, processer och modeller för hur man samlar in, organiserar, lagrar och får tillgång till data.