Prä- und Postdetermination im Italienischen am Beispiel des Wikipedia Korpus

1. Zur Anzahl der Tokens & POS – pro:POSS & det:DEF  

Bevor die Prä- und Postdeterminanten im Italienischen definiert werden, wurden die folgenden Tokens (und bzw. nach lemma & POS) ausgerechnet:

  • Anzahl der Tokens der sog. aggettivi possessivi
  • Anzahl der Tokens der sog. aggettivi possessivi sortiert by lemma
  • Anzahl der Tokens der sog. aggettivi possessivi sortiert by POS
  • Anzahl der Tokens der articoli determinativi
  • Anzahl der Tokens der articoli determinativi sortiert by POS

    Die deutlich großere Anzahl an pro:POSS mit dritter Person (2071 singular + 418 plural ) in Vergleich zu denen in erster Person (23 singlular + 37 plural ) ist auf die Textsorte zurückzuführen: Das Korpus betrifft einen informativen / expositiven Text.

    Es hat sich ein Problem bei der Einzelsuche des tokens „l'“ (verstanden als det:DEF) ergeben, indem die Syntax als Fehler markiert wurde.

    2. Prädeterminanten

Bei der Betrachtung mit einem Possessivpronomen (PRO:poss) hat sich das Folgende ergeben:

Am häufigsten kommt die folgende Sequenz vor:
DET:def – PRO:poss – NOM (1086)

Ebenso relevant sind die Ergebnisse in der folgenden Sequenz:
DET:def – PRO:poss – ADJ (206)

Die ersten Annahme, die Sequenz DET:def – PRO:poss – NUM wäre umfangreich gewesen, wurde in diesem Fall nicht bestätigt
DET:def – PRO:poss – NUM (4)

Bei einer Suche, die von der Präsenz eines Possessivpronomen unabhängig ist, lässt sich  Folgendes feststellen:

DET:def – ADJ – NOM (2557) es: l’unica squadra

DET:def    – NOM – ADJ (3202)    es: il    campionato    francese    

DET:def    – NUM – NOM (795)    es: il    24    ottobre

3. Postdeterminanten

Bei den Postdeterminanten hat sich die umgekehrte Sequenz ergeben:

NOM    – PRO:poss (43)    es: cose sue

Fehlermeldungen in der POS-Erkennung wurden in drei Fällen festgestellt

Mit DET:def konnte man nur zwei Einzelfälle feststellen.

count(b.token) exemplum exemplum token pos pos pos
1 le cose sue DET:def NOM PRO:poss
1 l‘ unica sua DET:def NOM PRO:poss

4. Beispiel: casa sua & sua casa VS le cose sue & le sue cose

 

5. Queries (Auswahl)

1.
SELECT count(token), token
FROM `wiki_it5`
WHERE token = ‚mia‘            
—–
SELECT count(token), token, lemma
FROM `wiki_it5`
WHERE lemma LIKE „suo“
group by token
—–
SELECT count(token), token
FROM `wiki_it5`
WHERE pos LIKE „pro:POSS“
group by token
ORDER BY count(token) DESC
—–
SELECT count(*), token , pos
FROM wiki_it5
WHERE token LIKE ’suo‘
GROUP by token , pos
ORDER by COUNT(token) DESC
—–
SELECT count(token), token, lemma
FROM `wiki_it5`
WHERE pos LIKE „det:DEF“
group by token order by COUNT(token) DESC                             

2.

SELECT count(a.token), a.token as exemplum ,b.token as exemplum, a.pos, b.pos
FROM wiki_it5 a
join `wiki_it5` b on (a.id_tokens=b.id_tokens-1)
WHERE a.pos LIKE „pro:POSS“
group by a.pos, b.pos
—–
SELECT count(a.token), a.token as exemplum ,b.token as exemplum, a.pos, b.pos
FROM wiki_it5 a
join `wiki_it5` b on (a.id_tokens=b.id_tokens-1)
WHERE a.pos LIKE „pro:POSS“
group by a.pos, b.pos order by a.pos ,
COUNT(a.token) DESC        
—–                                                    
SELECT count(a.token), a.token as exemplum ,b.token as exemplum, c.token , a.pos, b.pos , c.pos
FROM wiki_it5 a
join `wiki_it5` b on (a.id_tokens=b.id_tokens-1)
join `wiki_it5` c on (b.id_tokens=c.id_tokens-1)
WHERE a.pos LIKE „det:DEF“
group by a.pos, b.pos , c.pos
order by a.pos ,
COUNT(a.token) DESC                                
—–
SELECT count(a.token), a.token as exemplum ,b.token as exemplum, c.token , a.pos, b.pos , c.pos
FROM wiki_it5 a
join `wiki_it5` b on (a.id_tokens=b.id_tokens-1)
join `wiki_it5` c on (b.id_tokens=c.id_tokens-1)
WHERE a.pos LIKE „det:DEF“ and b.pos LIKE „pro:POSS“
group by a.pos, b.pos , c.pos
order by a.pos , b.pos                            
—–    
SELECT count(a.token), a.token as exemplum ,b.token as exemplum, a.pos, b.pos
FROM wiki_it5 a
join `wiki_it5` b on (a.id_tokens=b.id_tokens-1)
WHERE a.pos LIKE „pro:POSS“ AND b.POS LIKE „NOM“
group by a.token , b.token order by a.pos ,
COUNT(a.token) DESC                    
—–
SELECT d.svwiki,  a.token, b.token, c.token, d.token, e.token, f.token, g.token, h.token,  c.pos as C, d.pos AS SUA, e.pos, f.pos as egal , g.pos as egal, h.pos as egal
FROM wiki_it5 a
JOIN `wiki_it5` b on (a.id_tokens = b.id_tokens-1)
join `wiki_it5` c on (b.id_tokens = c.id_tokens-1)
join `wiki_it5` d on (c.id_tokens=d.id_tokens-1)
join `wiki_it5` e on (d.id_tokens=e.id_tokens-1)
join `wiki_it5` f on (e.id_tokens=f.id_tokens-1)
join `wiki_it5` g on (f.id_tokens=g.id_tokens-1)
join `wiki_it5` h on (g.id_tokens=h.id_tokens-1)
WHERE d.token = „sua“
group by e.pos, c.pos
—–
SELECT d.svwiki,  a.token, b.token, c.token, d.token, e.token, f.token, g.token, h.token, count(d.token) ,c.pos as C, d.pos AS SUA, e.pos, f.pos as egal , g.pos as egal, h.pos as egal
FROM wiki_it5 a
JOIN `wiki_it5` b on (a.id_tokens = b.id_tokens-1)
join `wiki_it5` c on (b.id_tokens = c.id_tokens-1)
join `wiki_it5` d on (c.id_tokens=d.id_tokens-1)
join `wiki_it5` e on (d.id_tokens=e.id_tokens-1)
join `wiki_it5` f on (e.id_tokens=f.id_tokens-1)
join `wiki_it5` g on (f.id_tokens=g.id_tokens-1)
join `wiki_it5` h on (g.id_tokens=h.id_tokens-1)

WHERE d.token = „sua“
group by e.pos, c.pos
order by e.pos, count(d.token) DESC                                
—–

3.                             
SELECT count(a.token), a.token as exemplum ,b.token as exemplum, a.pos, b.pos
FROM wiki_it5 a
join `wiki_it5` b on (a.id_tokens=b.id_tokens-1)
WHERE b.pos LIKE „pro:POSS“
group by a.pos, b.pos    
—–
SELECT count(b.token), a.token as exemplum ,b.token as exemplum, c.token, a.pos, b.pos , c.pos
FROM wiki_it5 a
join wiki_it5 b on (a.id_tokens=b.id_tokens-1)
join wiki_it5 c on (b.id_tokens=c.id_tokens-1)
WHERE c.pos LIKE „pro:POSS“ AND b.pos = „NOM“
group by b.pos, c.pos, a.pos, b.token, a.token
ORDER by count(b.token) DESC
—–
SELECT count(a.token), a.token as exemplum ,b.token as exemplum, a.pos, b.pos
FROM wiki_it5 a
join `wiki_it5` b on (a.id_tokens=b.id_tokens-1)
WHERE b.pos LIKE „pro:POSS“
group by a.pos, b.pos order by a.pos ,
COUNT(b.token) DESC
—–
SELECT count(b.token), a.token as exemplum ,b.token as exemplum, c.token, a.pos, b.pos , c.pos FROM wiki_it5 a join wiki_it5 b on (a.id_tokens=b.id_tokens-1) join wiki_it5 c on (b.id_tokens=c.id_tokens-1)

WHERE c.pos LIKE „pro:POSS“ AND b.pos = „NOM“ AND a.pos = „DET:def“ group by b.pos, c.pos, a.pos, b.token, a.token

ORDER by count(b.token) DESC
4.
SELECT a.token, b.token, a.pos, b.pos
FROM wiki_it5 a   
join wiki_it5 b on (a.id_tokens = b.id_tokens-1)
WHERE a.token = „sua“ AND b.token = „CASA“                                            

—–
SELECT a.token ,b.token , c.token, d.token, e.token, f.token, g.token, h.token, d.pos, e.pos , f.pos , g.pos
FROM wiki_it5 a
join `wiki_it5` b on (a.id_tokens=b.id_tokens-1)
join `wiki_it5` c on (b.id_tokens = c.id_tokens-1)
join `wiki_it5` d on (c.id_tokens=d.id_tokens-1)
join `wiki_it5` e on (d.id_tokens=e.id_tokens-1)
join `wiki_it5` f on (e.id_tokens=f.id_tokens-1)
join `wiki_it5` g on (f.id_tokens=g.id_tokens-1)
join `wiki_it5` h on (g.id_tokens=h.id_tokens-1)
WHERE e.token = „sua“ AND f.token = „CASA“                                                
—–

SELECT a.token ,b.token , c.token, d.token, e.token, f.token, g.token, h.token, d.pos, e.pos , f.pos , g.pos
FROM wiki_it5 a join `wiki_it5` b on (a.id_tokens=b.id_tokens-1)
join `wiki_it5` c on (b.id_tokens = c.id_tokens-1)
join `wiki_it5` d on (c.id_tokens=d.id_tokens-1)
join `wiki_it5` e on (d.id_tokens=e.id_tokens-1)
join `wiki_it5` f on (e.id_tokens=f.id_tokens-1)
join `wiki_it5` g on (f.id_tokens=g.id_tokens-1)
join `wiki_it5` h on (g.id_tokens=h.id_tokens-1)
WHERE e.token = „casa“ AND f.token = „sua“

 

Schreibe einen Kommentar