Changes between Version 1 and Version 2 of cs/ZpracovaniMetainformaci


Ignore:
Timestamp:
Jul 1, 2014, 2:00:36 PM (6 years ago)
Author:
xkocinc
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • cs/ZpracovaniMetainformaci

    v1 v2  
    2727$ cat /nlp/corpora/vertical/INFO_O_DUPLICITACH/vertikal.list \
    2828| egrep ':eco:eco$' \          #vybereme radky odpovidajici dokumentum z ekonomiky
    29 | cut -d: -f4-6 \                #vybereme udaje pro program list2vert
    30 | list2vert                     #ze seznamu dokumentu vytvorime vertikalni text
     29| cut -d: -f4-6 \              #vybereme udaje pro program list2vert
     30| list2vert                    #ze seznamu dokumentu vytvorime vertikalni text
    3131}}}
    3232== Metainformace jako SQL databáze == #Metainformace_jako_SQL_datab.2BAOE-ze
     
    44444 sloupce
    4545mysql> explain vertical_M;
    46 +--------+---------------------+------+-----+---------+-------+
    47 | Field  | Type                     | Null | Key | Default | Extra |
    48 +--------+---------------------+------+-----+---------+-------+
    49 | Doc     | varchar(255) binary |        | MUL |            |         |
    50 | M_Auth | varchar(255)          | YES  |      | NULL     |         |
    51 | M_Date | date                     | YES  |      | NULL     |         |
    52 | M_Desc | varchar(255)          | YES  |      | NULL     |         |
     46+--------+----------------------+------+-----+---------+-------+
     47| Field  | Type                 | Null | Key | Default | Extra |
     48+--------+----------------------+------+-----+---------+-------+
     49| Doc    | varchar(255) binary  |      | MUL |         |       |
     50| M_Auth | varchar(255)         | YES  |     | NULL    |       |
     51| M_Date | date                 | YES  |     | NULL    |       |
     52| M_Desc | varchar(255)         | YES  |     | NULL    |       |
    5353+--------+---------------------+------+-----+---------+-------+
    5454}}}
     
    145145$ head -2 /nlp/corpora/vertical/SQL_DATA/vertical
    146146Y    Y    \N    1998-01-01    \N    S/J/1998/150/001    150 hori    1998-01-01    \N    cs    99    88    j    101    5373    \N    6F59FE5D    695    cnk_nove    \N    sec    Y    \N    \N    cnk/150hori/150.vert
    147 Y    Y    \N    1998-01-01    \N    S/J/1998/150/003    150 hori    1998-01-01    \N    cs    94    69    j    7858    4463    \N    5E84F5FB    662    cnk_nove    \N    sec    Y    \N    \N    cnk/150hori/150.vert
     147Y    Y    \N    1998-01-01    \N    S/J/1998/150/003    150 hori    1998-01-01    \N    cs    94    69    j    7858   4463    \N    5E84F5FB    662    cnk_nove    \N    sec    Y    \N    \N    cnk/150hori/150.vert
    148148}}}
    149149Převod  z metainformací do tohoto formátu provede program meta2sql, který jako  svůj vstup očekává jméno souboru a vytvoří dva soubory s koncovkami  .sql1 a .sql2. Takže použití:
     
    175175| CONCAT(Position_offset,',',Position_length,':',Doc,':',Vertikal) |
    176176+------------------------------------------------------------------+
    177 | 5231183,14467:S/NWS/1995/hnb5/1994:cnk/HN/hnb5.vert                  |
    178 | 4645,15025:S/NWS/1999/ln99086e/003:cnk/LN/1999/ln99086e.vert      |
     177| 5231183,14467:S/NWS/1995/hnb5/1994:cnk/HN/hnb5.vert              |
     178| 4645,15025:S/NWS/1999/ln99086e/003:cnk/LN/1999/ln99086e.vert     |
    179179+------------------------------------------------------------------+
    1801802 rows in set (0.07 sec)