Glossari
Terme català |
Terme anglès |
Definició |
Principals àmbits temàtics |
Actius digitals | Digital assets | D’acord amb la definició del Decret 76/2020, de 4 d’agost, d’Administració digital, són actius digitals els fitxers de dades, d’imatges, de sons, de text i multimèdia, així com qualsevol tipus de dada o de representació d’informació, entre els quals hi ha els documents administratius. Els actius digitals es generen, es gestionen o es conserven en els sistemes de gestió de dades, en els sistemes de gestió de documents, en el web corporatiu, en la Seu electrònica de l’Administració de la Generalitat, entre d’altres. | Govern Dada: Normativa |
Aprenentatge automàtic | Machine Learning | És un camp de la intel·ligència artificial que està dedicat al disseny, l’anàlisi i el desenvolupament d’algorismes i tècniques que permeten que les màquines evolucionin. Més concretament, és una àrea multidisciplinària que, a través de ciències com la computació, les matemàtiques, la lògica i la filosofia, estudia la creació i el disseny de programes capaços de generalitzar comportaments a partir del reconeixement de patrons o classificació i de sistemes capaços de resoldre problemes quotidians per si mateixos, utilitzant com a paradigma la intel·ligència humana. | Tractament Dades: Machine Learning i AI |
Aprenentatge profund | Deep learning | És una tècnica d’extracció i transformació de noves característiques del processament de la informació, les quals poden ser de forma supervisada o no. Concretament, són algoritmes que funcionen en un sistema per capes, simulant el funcionament bàsic del cervell que s’utilitza amb les neurones. És a dir, el conjunt de capes que forma l’aprenentatge profund representa les neurones del cervell. Aquest mètode va ser promogut als anys 80 per l’investigador japonès Kunihiko Fukushima, el qual va proposar un model neuronal entre cinc i sis capes anomenat “neocognitró”. Entre altres aplicacions s’utilitza pel reconeixement automàtic de la veu, reconeixement d’imatges, processament de llenguatge natural o bioinformàtica. | Tractament Dades: Machine Learning i AI |
Base de dades | Database | És una recopilació organitzada d’informació o dades estructurades, que generalment s’emmagatzema de manera electrònica en un sistema informàtic, i que està gestionada per un sistema de gestió de bases de dades (DBMS). | Govern Dada: Tecnologia |
Cadena de blocs | Blockchain | És una base de dades distribuïda, formada per cadenes de blocs dissenyades per evitar-ne la modificació un cop que una dada ha estat publicada; emprant un segellat de temps confiable i enllaçant a un bloc anterior. Per aquesta raó, és especialment adequada per emmagatzemar de forma creixent dades ordenades en el temps i sense possibilitat de modificació ni revisió. Les cadenes de blocs poden ser públiques o privades, en funció de si l’enviament de transaccions està limitat o no. Hi poden haver casos intermedis. Les blockchain s’usen en el camp de les criptomonedes; també com a notari distribuït en diferents tipus de transaccions bancàries fent-les més segures, barates i traçables; i com a base de plataformes descentralitzades que permeten suportar la creació d’acords de contracte intel·ligent entre parells. | Govern Dada: Tecnologia |
Catàleg de dades | Data catalog | És un inventari detallat de tots els actius de dades d’una organització, dissenyat per ajudar als professionals de la gestió de les dades a trobar ràpidament les dades més apropiades per a qualsevol propòsit comercial o analític. | Govern Dada: Modelització i metodologies |
CDO (Director/a de dades) | CDO (Chief Data Officer) | És el responsable de totes les dades d’una organització, que les gestiona i analitza amb la finalitat d’integrar-les en l’estratègia de negoci de l’entitat. Es tracta d’un perfil, que es diferencia i complementa al chief information officer (CIO), ja que és més proper a negoci i no tant als sistemes d’informació. | Tractament Dades: Competències professionals |
Conjunt de dades | Dataset | Conjunt complet de dades, incloent-hi les taules que contenen, ordenen i restringeixen les dades, així com les relacions entre les taules. | Govern Dada: Tecnologia |
Dades | Data | Representació de fets, conceptes o instruccions de manera formalitzada, i adequada per a la seva comunicació, interpretació o processament per mitjans automàtics o humans. | Govern Dada: Tecnologia |
Dades de referència | Reference data | Són un tipus especial de dades orientades amb propòsits de classificació (codificacions i estàndards) o de suport a la gestió; en essència són codis que bàsicament transformen dades en informació significativa pel negoci. | Govern Dada: Modelització i metodologies |
Dades en brut | Raw data | Són les dades que es capturen directament de la font d’origen i que no són processades. Per contra, les dades processades (transformades, netejades u organitzades) es coneixen com a dades cuinades (cooked data). | Govern Dada: Modelització i metodologies |
Dades mestres | Master data | Són les dades crítiques de les operacions de negoci, ja que fan referència a les entitats que són transversals a tota l’organització (persones, ubicacions, productes, etc.). És important que siguin gestionades i disposar d’un únic registre fiable on les dades mestres es mantinguin actualitzades, integrades i netes (golden record). | Govern Dada: Modelització i metodologies |
Dades obertes | Open Data | Són conjunts de dades que es posen a disposició del públic i poden ser reutilitzats i redistribuïts lliurament per qualsevol persona, i que es troben subjectes al requisit d’atribució i de distribució de la mateixa manera que apareixen. | Tractament Dades: Tecnologies semàntiques |
Diccionari de dades | Data Dictionary | Repositori centralitzat d’informació que recull la relació completa dels conjunts de dades, taules, atributs, tipus de dades dels atributs i significats dels valors que formen una base de dades, juntament amb les seves descripcions. | Govern Dada: Modelització i metodologies, Govern Dada: Tecnologia |
Ètica algorítmica | Algorithmic ethics | Conjunt de normes que conformen la dimensió ètica i que s’han de tenir en consideració a l’hora de desenvolupar sistemes d’intel·ligència artificial. L’objectiu d’aquestes regles és gestionar la creació i dinàmica dels algoritmes sota uns paràmetres que no generin ni reprodueixin injustícies, i que es tingui en consideració les implicacions socials sobretot quan aquests algorismes s’utilitzen per a la presa de decisions que impliquen a persones (selecció de personal, accés a la universitat, accions judicials, etc.) | Tractament Dades: Machine Learning i AI |
Glossari de negoci | Business glossary | És una llista de termes empresarials i les seves definicions que les organitzacions utilitzen per garantir que s’usen les mateixes definicions a tota l’empresa. És a dir, un glossari de negocis produeix un vocabulari de negocis comú que utilitzen tots en una organització. | Govern Dada: Modelització i metodologies |
Governança de dades | Data governance | És el sistema de drets de decisió i responsabilitats que assegura que les dades es gestionen correctament. S’hi identifiquen tots aquells processos, òrgans, rols/responsabilitats i instruments per a l’exercici d’autoritat i control sobre les dades. Pel que fa a la traducció del terme data governance al català, en alguns casos s’equipara a govern de les dades i, en altres, a governança de dades. | Govern Dada: Normativa, Govern Dada: Tecnologia |
Graf | Graph | Conjunt d’objectes o nodes connectats per enllaços anomenats arestes o arcs formant relacions binàries. Els grafs poden ser dirigits, és a dir, amb enllaços entre nodes direccionals o bé no dirigits on els enllaços són simètrics i no representen un sentit definit. RDF forma part de la categoria dels grafs dirigits. | Tractament Dades: Machine Learning i AI, Tractament Dades: Tecnologies semàntiques |
Graf de coneixement | Knowledge graph | Representa una xarxa d’entitats del món real, és a dir, objectes, esdeveniments, situacions o conceptes, i inclou semànticament la relació entre ells. Aquesta informació generalment s’emmagatzema en una base de dades de grafs. Exemples famosos de grafs són Google Knowledge Graph, Wikidata o Dbpedia.
També es coneix com a xarxa semàntica. |
Tractament Dades: Tecnologies semàntiques |
Inferència | Inference | És el procés per a la generació de conclusions lògiques per part de les màquines a partir d’un conjunt de suposicions inicials. Opera sobre les lògiques descriptives i és un camp abastament desenvolupat en el marc del Web Semàntic. Mitjançant l’ús de dades vinculades, les relacions existents es modelen com un conjunt de relacions entre recursos. Les dades vinculades ajuden els humans i les màquines a trobar noves relacions a través de procediments automàtics que generen (infereixen o dedueixen) noves relacions basades en les dades i en alguna informació addicional que pot ser definida a partir d’ontologies o bé de regles. | Tractament Dades: Machine Learning i AI, Tractament Dades: Tecnologies semàntiques |
Interoperabilitat semàntica | Semantic Interoperability | És un dels tres components de la interoperabilitat (organitzativa, tècnica i semàntica) que opera sobre el significat, és a dir, sobre un coneixement compartit. Garanteix que les dades i la informació intercanviada sigui interpretada i compresa per les parts implicades. Inclou la definició de taxonomies, vocabularis controlats, tesaures, llista de codis, ontologies i models de dades reutilitzables. Bona part de les tecnologies del Web Semàntic operen sobre aquesta premissa. | Tractament Dades: Tecnologies semàntiques |
LD (Dades Enllaçades) | LD (Linked Data) | Procediment per vincular entre si conjunts de dades llegibles per màquina utilitzant tècniques del Web Semàntic, especialment mitjançant l’ús de RDF i URI. Habilita consultes SPARQL distribuïdes dels conjunts de dades i un enfocament de navegació o descobriment per trobar informació (en comparació amb una estratègia de recerca). Les dades vinculades estan destinades a l’accés tant per part d’humans com de màquines. Linked Data utilitza la família d’estàndards RDF per a l’intercanvi de dades (per exemple, RDF/XML, RDFa, Turtle) i consultes (SPARQL). Si les dades enllaçades es publiquen en obert, generalment es denominen Dades Obertes Enllaçades o LOD (Linked Open Data, en anglès). | Tractament Dades: Tecnologies semàntiques |
Lingüística computacional | Computational Linguistics | És la disciplina científica i d’enginyeria que s’ocupa de comprendre el llenguatge escrit i parlat des d’una perspectiva computacional, i de construir artefactes que processin el llenguatge de manera útil. En la mesura que el llenguatge és un mirall de la ment, una comprensió computacional del llenguatge també proporciona una visió del pensament i la intel·ligència. En el seu desenvolupament, hi participen lingüistes i informàtics especialitzats en intel·ligència artificial, psicòlegs cognoscitius i experts en lògica, entre d’altres. | Tractament Dades: Machine Learning i AI, Tractament Dades: Tecnologies semàntiques |
Llac de dades | Data lake | És un repositori centralitzat que permet emmagatzemar totes les dades en brut, estructurades i no estructurades, a qualsevol escala. És a dir, es poden emmagatzemar les dades sense necessitat de modificar-les ni d’estructurar-les primer. Addicionalment es poden executar diferents tipus d’anàlisi: des de panells i visualitzacions fins a processament de macrodades, anàlisi en temps real i machine learning per a la presa de millors decisions. | Govern Dada: Tecnologia |
Llenguatge d’Ontologies Web | OWL (Web Ontology Language) | És una família de llenguatges de representació de coneixement i descripció de vocabulari per a la creació d’ontologies, basada en RDF i estandarditzada pel W3C. La versió actual és OWL 2. Integra lògica descriptiva per facilitar tasques de raonament a partir de l’ús de la intel·ligència artificial amb l’objectiu d’inferir coneixement. | Tractament Dades: Tecnologies semàntiques |
Llinatge de dades | Data lineage | Fa referència a l’origen, moviments i característiques de les dades. En concret, és l’àrea que descriu el cicle de vida de les dades, que inclou els orígens i el lloc en què es mouen amb el pas del temps. També incorpora aspectes de detall com qui utilitza les dades, quan s’accedeix a la informació o com es relacionen entre elles. | Govern Dada: Tecnologia |
LOD (Dades Obertes Enllaçades) | LOD (Linked Open Data) | Dades vinculades publicades i llicenciades sota una de les diverses llicències obertes que permeten la reutilització. La publicació de dades obertes vinculades possibilita consultes SPARQL distribuïdes dels conjunts de dades i un enfocament de «navegació» o «descobriment» per trobar informació, en comparació amb una estratègia de recerca. | Tractament Dades: Tecnologies semàntiques |
Lògica de descripció | Description Logic | Família de llenguatges de representació del coneixement que poden ser usats per representar coneixement terminològic d’un domini d’aplicació, d’una forma estructurada i formalment ben compresa. La lògica de descripció s’utilitza en intel·ligència artificial per al raonament formal sobre els conceptes d’un determinat domini. Al Web Semàntic, OWL incorpora una semàntica de descripció lògica. | Tractament Dades: Machine Learning i AI, Tractament Dades: Tecnologies semàntiques |
LOV (Vocabularis Oberts i Enllaçats) | LOV (Linked Open Vocabularies) | Principal repositori d’ontologies (vocabularis) que opera al servei de la iniciativa Linked Open Data (LOD) en el marc del Web Semàntic. Entre les ontologies GLAM (Arxius, biblioteques, museus i galeries) es troben l’ontologia RIC-O (arxius), CIDOC CRM (museus), FRBR, FRAD, BIBFRAME, RDA (biblioteques), entre altres. La seva funció es contribuir al descobriment d’ontologies i la seva reutilització en processos d’enginyeria ontològica. | Tractament Dades: Tecnologies semàntiques |
Magatzem de dades | Data Warehouse | Repositori centralitzat que emmagatzema dades estructurades provinents de diferents orígens. Aquestes dades passen per processos ETL (extracció, transformació i càrrega) a fi de netejar-les i normalitzar-les abans del seu emmagatzematge. | Govern Dada: Tecnologia |
Malla de dades | Data mesh | Es tracta d’un enfocament sociotècnic per construir una arquitectura de dades descentralitzada aprofitant un disseny d’autoservei orientat al domini. S’ocupa principalment de les dades en si, prenent el data lake (llac de dades) com una preocupació secundària. La proposta principal és escalar les dades analítiques mitjançant la descentralització orientada al domini. Així mateix, suposa la transferència de responsabilitat de les dades analítiques des de l’equip central de dades als equips de domini, a partir d’una plataforma de dades independent al domini. | Govern Dada: Modelització i metodologies |
Mineria de dades | Data Mining | És un camp que combina l’estadística, la lingüística computacional i les ciències de la computació orientat al descobriment de patrons en grans volums de conjunts de dades. Utilitza procediments de la intel·ligència artificial, com ara l’aprenentatge automàtic així com sistemes de gestió de bases de dades. Opera principalment en entorns de dades estructurades o semi estructurades. | Tractament Dades: Machine Learning i AI |
Mineria de textos | Text Mining | És una branca específica de la mineria de dades. Analitza informació procedent de fonts de dades no estructurades com ara pàgines web, correus electrònics, publicacions digitals o digitalitzades, premsa, etc. Entre els seus objectius destaca l’explicitació d’informació implícita a través de la identificació de patrons. Com en el cas de la mineria de dades, es tracta d’un camp multidisciplinari basat en la recuperació de la informació, la utilització de la intel·ligència artificial i la lingüística computacional. | Tractament Dades: Machine Learning i AI |
Model de dades | Data model | Són representacions visuals dels elements de dades d’una organització i les seves vinculacions. Aquests diagrames descriuen l’estructura lògica de les dades, el que inclou les relacions i les restriccions que s’hi determinen. Així mateix, en l’Esquema Nacional d’Interoperabilitat (ENI) es defineix com el conjunt de definicions (model conceptual), interrelacions (model lògic) i regles i convencions (model físic) que permeten descriure les dades per al seu intercanvi | Govern Dada: Modelització i metodologies |
OAI – ORE | OAI – ORE (Open Archives Initiative Object Reuse and Exchange) | Defineix estàndards per a la descripció i intercanvi d’ agregacions de recursos web. Aquestes agregacions, de vegades anomenades objectes digitals compostos, poden combinar recursos distribuïts amb múltiples tipus de mitjans, incloent-hi text, imatges, dades i vídeo. L’ objectiu és exposar el contingut ric en aquestes agregacions a aplicacions que donin suport a la creació, emmagatzematge, intercanvi, visualització, reutilització i preservació. | Tractament Dades: Tecnologies semàntiques, Tractament Dades: Visualització i explotació |
OAI – PMH | OAI – PMH (Open Archives Initiative Protocol for Metadata Harvesting) | Protocol d’interoperabilitat per a l’intercanvi d’informació entre repositoris institucionals. El protocol opera amb l’esquema de metadades Dublin Core no qualificat, que utilitza una mínima semàntica com a sistema per resoldre els problemes derivats de la diversitat d’estàndards que empra cada domini del coneixement. | Tractament Dades: Tecnologies semàntiques, Tractament Dades: Visualització i explotació |
Pla de gestió de dades | Data management plan | És un document formal que serveix per a la gestió de les dades d’investigació. Concretament, detalla com es gestionaran les dades durant la investigació i també quan el projecte hagi finalitzat. Inclou, entre altres aspectes, una descripció del cicle de vida de les dades capturades, generades i processades durant el projecte, així com qüestions vinculades a la preservació i compartició de dades, el seu emmagatzematge, etc. | Govern Dada: Modelització i metodologies |
Qualitat de dades | Data quality | Grau en què un conjunt de característiques inherents a les dades compleix amb els requisits establerts. | Tractament Dades: Descripció i preservació |
Raonament semàntic | Semantic reasoning | És la capacitat d’un sistema per inferir nou coneixement a partir de dades existents basades en regles d’inferència i ontologies. En termes senzills, les regles afegeixen nova informació al conjunt de dades existent, afegint context, coneixement i informació valuosa. Aquesta és una forma d’intel·ligència artificial semàntica. Les eines especialitzades en la inferència de nou coneixement s’anomenen raonadors semàntics. El camp del raonament semàntic ha estat, tradicionalment, un dels àmbits de tractament preferent del Web Semàntic. | Tractament Dades: Tecnologies semàntiques |
RDF (Marc de Descripció de Recursos) | RDF (Resource Description Framework) | És un marc per representar informació al Web. Defineix una sintaxi abstracta (un model de dades) que serveix per vincular tots els llenguatges i especificacions basats en RDF. La sintaxi abstracta té dues estructures de dades clau: els grafs RDF són conjunts de tripletes subjecte-predicat-objecte, on els elements poden ser IRI (Internationalized Resource Identifier), nodes en blanc o literals amb tipus de dades. S’utilitzen per expressar descripcions de recursos. | Tractament Dades: Tecnologies semàntiques |
RDFa (Marc de Descripció de Recursos en Atributs) | RDFa (Resource Description Framework in Attributes) | Sintaxi RDF codificada en documents HTML. RDFa proporciona un conjunt d’atributs de marcatge per introduir semàntica als documents dins dels elements meta i link. És un estàndard del World Wide Web Consortium (W3C). S’han definit procediments i correspondències per facilitar l’extracció de la informació en tripletes RDF. |
Tractament Dades: Tecnologies semàntiques |
Repositori RDF | Triplestore | Base de dades especialment dissenyada per a l’emmagatzematge i recuperació de tripletes a través de consultes semàntiques per mitjà del llenguatge de consulta SPARQL. | Tractament Dades: Tecnologies semàntiques |
Sistemes bioinspirats | Bioinspire systems | Són sistemes informàtics que emulen la forma de pensar, la manera de processar informació i resolució de problemes dels sistemes biològics. Per dissenyar aquests sistemes, a més d’utilitzar la computació numèrico-simbòlica, s’usen un altre tipus de mètodes com les xarxes neuronals artificials, la lògica difusa i la computació evolutiva. | Govern Dada: Tecnologia, Tractament Dades: Descripció i preservació |
SKOS | SKOS (Simple Knowledge Organization System) | Àrea de treball que desenvolupa especificacions i estàndards per donar suport a l’ús de sistemes d’organització del coneixement (KOS) com ara tesaures, esquemes de classificació, sistemes d’encapçalaments de matèries i taxonomies en el marc de la web semàntica. SKOS proporciona una manera estàndard de representar els sistemes d’organització del coneixement mitjançant el Resource Description Framework (RDF). Codificar aquesta informació en RDF permet compartir-la entre aplicacions informàtiques de manera interoperable. | Tractament Dades: Tecnologies semàntiques |
SPARQL | SPARQL (Protocol and RDF Query Language) | Defineix un llenguatge de consulta per a dades RDF, anàleg al llenguatge de consulta estructurat (SQL) per a bases de dades relacionals. A diferència de les bases de dades relacionals, opera sobre grafs i no sobre taules. | Tractament Dades: Tecnologies semàntiques |
Teixit de dades | Data fabric | És una arquitectura de serveis i funcionalitats que contribueix a processar millor els volums de dades procedents de diverses fonts. És a dir, té la capacitat d’agrupar-les sota un mateix núvol o sistema d’administració, sense importar d’on provenen aquestes dades. D’aquesta manera, les organitzacions poden treballar més àgilment amb grans quantitats de dades en creixement constant, requisits d’aplicacions canviants i escenaris de processament distribuït dins d’un espai unificat que permet l’accés i l’intercanvi d’informació sense friccions. Aquesta arquitectura sorgeix com a resposta al context cada cop més complex de les organitzacions, en el que ja no és suficient emmagatzemar les dades en un data warehouse o data lake. | Govern Dada: Tecnologia |
Tripleta RDF | RDF Triple | És la unitat bàsica d’un graf RDF (declaració RDF), que consta de dues entitats (un «subjecte» i un «objecte») i una relació entre ells (un verb o «predicat») que conformen una tripleta subjecte-predicat-objecte. Per exemple: “El 19è congrés d’arxivística” (subjecte) “es realitza” (predicat) “a Sant Cugat” (Objecte). | Tractament Dades: Tecnologies semàntiques |
Visualització de dades | Data visualization | Disciplina de representació visual l’objectiu de la qual és comunicar informació o idees complexes de forma clara, precisa i eficient, de forma que ajudi als usuaris a analitzar i raonar sobre dades i evidències. | Tractament Dades: Visualització i explotació |
Web semàntic | Semantic Web | Conjunt de tecnologies impulsades des del World Wide Web Consortium (W3C) orientades a la creació de tecnologies i procediments per publicar dades llegibles per màquines. Es fonamenta en el paradigma de semantitzar (atorgar significat) la World Wide Web (WWW) a partir de la utilització d’ontologies. Aquestes, aporten informació addicional per a la descripció del contingut, significat i la relació de les dades. L’objectiu és millorar Internet ampliant la interoperabilitat entre els sistemes informàtics a través de la utilització d’agents intel·ligents o agents de software, és a dir, de programes que rastregen informació de forma autònoma. | Tractament Dades: Tecnologies semàntiques |
Xarxa neuronal artificial | Artificial Neural Network (ANN) | Paradigma d’aprenentatge i processament automàtic inspirat en la forma en què funciona el sistema nerviós dels animals. Concretament, es tracta d’un sistema d’interconnexió de neurones en una xarxa que col·labora per produir un estímul de sortida, i que utilitza un model matemàtic o computacional de processament de dades basat en una aproximació connexionista per a la computació. | Tractament Dades: Machine Learning i AI |