Skip to main content

Co je porovnávání schématu?

Srovnání schématu je technika používaná k sloučení dvou nebo složitějších databází nebo sad informací do sebe.Vzhledem k tomu, že používání databází a elektronického ukládání informací zvětšuje a složitější přes internet, musí být definované metody sloučení sad dat z jedné databáze do druhé a porovnávání schématu je jednou z takových technik.Koncept je jednoduchý, ale realita sloučení dat je poměrně složitá.

Termín porovnávání schématu se používá synonymně s mapováním schémat, protože uživatelé jsou skutečně mapováním dat, které je neshodují.Dvě nebo více databází jsou mapovány společně a podobné aspekty každé databáze jsou navzájem mapovány.Nejběžnějším způsobem sloučení dat je použití přesných odkazů.Příkladem tohoto stylu sloučení je kombinace jmen sloupce jedné databáze s sloupcem názvu jiné databáze.

Sloučení není obvykle tak jednoduché, pro lidi nebo počítače.S tolika údaji, které potřebují být filtrovány, kombinované a použité, je nezbytné mít jednu databázi než s více databázemi.Mapování schématu se zaměřuje na to, aby byl tento únavný proces automatizován a efektivnější.Příkladem toho, kde je nutné porovnávat schéma, může být, když jedna databáze má hlavní pole studentů a druhá databáze má studentovu oboru studie.Je to stejné informace, ale mírně odlišné tituly komplikují úsilí o jeho smíchání.Než bude možné sloučit více databází, je třeba je analyzovat z hlediska podobností a rozdílů.V oblasti shody schématu se to nazývá předintegrace.Počítač začíná určovat nejúčinnější metodu integrace.

Dále počítač vyhodnocuje schémata jejich vzájemným porovnáním na podrobnější úrovni.V kroku srovnání se počítač dívá na každou položku databáze a určuje, kde mohou dojít ke konfliktům.Příkladem toho je, když pole zájmu studenta uvádí lékaře a další databáze je uvádí jako lékaře.Osoba by pravděpodobně rozpoznala informace jako stejné, ale pro databázové nástroje jsou to dvě samostatné entity.To může být stejně jednoduché jako změna všech případů lékaře na lékaře.Ve skutečnosti je tento proces podstatně složitější.

Jakmile jsou všechny konflikty fixovány, může počítač pokračovat se sloučením dat do procesu porovnávání schématu.V této fázi jsou dvě nebo více databází sloučeny do jedné velké databáze.Pokud vše půjde dobře, během integrace a budoucí přístup k databázi nedojde k žádné konflikty ani chybám.