Integreerimise lühimärkmed
Allikas: Lambda
Data warehouse: integreerimise standardpõhjus
ettevõttes hirmus palju osakondi, rakendusi, värke, igaüks eraldi seega mingeid joine ei saa teha
Lahendus data warehouse: teeme iga baasi külge proge, mis ööseti pumpab päeva data kesksesse baasi ühisesse schemasse:
- sellelt saab teha joine
- tekivad päevased snapshotid
Et data warehouse tekiks, on vaja teha nn ETL proged:
- Extract proged
- Transform proged: teisendab data ühise schema jaoks
- Load: pumpad transformituddata warehouse andmebaasi
Põhieesmärk data warehousel: regulaarne ülevaateraportite tegemine.
Linked data: teine suund/eesmärk integreerimiseks
Andmete scrapemine webist ja kogumine apidest ehk machine-readable web.
Selle ideoloogiline fookus läks "semantic web" projekti, mis muutus akadeemiliseks ja ebapraktiliseks. Põhiefekt oli push kasutada rdf-i universaalse dataformaadina. Tim Berners-Lee rebrandis ja refokuseeris oma tegevuse ses suunas hiljem kui "Linked Data" .