Zoek
English
  Studiegidsen 2008-2009
Radboud UniversiteitStudiegidsenFaculteit der Natuurwetenschappen, Wiskunde en Informatica > Bachelor Informatica en Informatiekunde

Opslaan en Terugvinden 

Vakcode
IPK003
Studiepunten
6
Periode
tweede semester
Inleiding

Deze cursus behandelt de karakteristieken van opslagmedia, hoe men de gegevens hierop ordent tot een betrouwbaar file systeem.

Vervolgens wordt ingegaan op het efficiënt opslaan van gegevenstabellen in bestanden (B-bomen, hashing). De relationele algebra wordt gebruikt als intermediair tussen SQL en file systemen. Query optimalisatie wordt nader toegelicht.

Vervolgens worden algemene opvraagtechnieken besproken (information retrieval), de toepassing hiervan op semi-gestructureerde gegevens en de relatie met algemene opslagtechnieken als XML.

Leerdoelen
Na deze cursus:
  1. kan de student de diverse gangbare opslagtechnieken beschrijven met hun gedrag voor de elementaire toegangspatronen,
  2. heeft de student inzicht in de uitvoering van SQL queries in termen van relationele algebra, en heeft basiskennis van query optimalisatie,
  3. kent de student de belangrijkste opslagtechnieken (ISAM, B-bomen, hashing),
  4. kent de student de basisprincipes van Information Retrieval,
  5. heeft de student kennis van gestructureerde documenten en hun representatie en bewerking met behulp van XML.
Onderwerpen
De cursus is georganiseerd in 3 blokken:
  1. Elementaire organisatie opslagmedia
    • Eigenschappen en karakteristieken van opslagmedia.
    • Klassieke file management systemen, met name de geheugenallocatie.
    • Geheugenbeheer. Het belang wordt toegelicht, de belangrijkste technieken worden besproken.
    • Het ontwerpen van fout-tolerante systemen; hieruit wordt de RAID technologie afgeleid.
    • Geavanceerde file management systemen.
  2. Bestandsorganisatie.
    • Relationele Algebra. Deze wordt formeel ingevoerd, de vertaling vanuit SQL, query optimalisatie (de pushdown normalform) en de relatie met datawarehouses worden bespreoken.
    • Records. Elementaire groeperingstechnieken, die ook geschikt zijn voor datacommunicatie toepassingen.
    • Lijst structuren.
    • De ISAM organisatie.
    • B+ bomen.
    • Hashing. Twee hoofdvarianten worden besproken: linear hashing en extendible hashing.
  3. Retrieval en gestructureerde documenten
    • Information Retrieval. Besproken worden onder andere het vector model en tf-idf weighting.
    • XML. Moderne technieken voor semi-gestructureerde data, de daarbij behorend object modellen, pad expressies en retrieval algebra worden besproken. XML wordt geintroduceerd.
    • Concurrency. De problematiek wordt toegelicht, ACID transactions en de oplosmethoden zoals die binnen SQL gangbaar zijn worden besproken.
    • Security. Het probleem wordt toegelicht, de SQL beveiligingsmechansimen worden besproken.
Studielastverdeling
  • 32 uur hoorcollege
  • 32 uur werkcollege
  • 104 uur zelfstudie
Toetsvorm

De cursus is onderverdeeld in 3 blokken. Elk blok wordt met een toets afgesloten.

Daarnaast dienen de deelnemers een kleine eigen bijdrage te verzorgen.

Het eindtentamen bestaat uit 4 onderdelen, de eerste 3 onderdelen corresponderen met de 3 blokken, de laatste opgave met de eigen bijdrage. Men dient op dit afsluitende tentamen alleen die onderdelen te maken die nog niet gehaald zijn.

Het is essentieel de wekelijkse oefenopdrachten te maken!

Voor het hertentamen is bovenstaande vrijstellingsregeling niet van toepassing.

The exam for this course consists of 4 exercises, which lead to a mark (e).

The first three exercises correspond to the three parts of the course. If the corresponding test resulted in a mark ≥ 6, then the participant may choose to skip this of the exam. In that case the mark for the test is the mark for that exercise.Would the participant choose to make the exam exercise, then the mark for the test is assumed to be cancelled.

The 4th exercise is associated with the personal student contribution.If this contribution has a mark ≥ 6, then will be the score of exercise 4. In the other case, the student will have to make exercise 4.

During the course homework exercises will be handed out. Each exercise is reviewed with a score -1, 0 or +1. This results in a bonus/malus score (b).

The final result is obtained by rounding from the result of:

if e ≥ 6 then e + b/10else eThis special arrangement is not valid during the re-exam.
Vereiste voorkennis
Vakken uit het 1e semester van Informatiekunde.
Literatuur

College-aantekeningen worden verspreid via Blackboard. Achtergrondinformatie vindt men in:

  1. Ramez Elmasri, Sham Navathe, Fundamentals of Database Systems, Addison Wesley
  2. Jeffrey D. Ullman, Jenniger Widom,A first course in database systems, Pearson Education International
Website
http://www.cs.ru.nl/is/edu/OnT/
Bijzonderheden

Deze cursus maakt deel uit van de Da Vinci reeks van cursussen.