epl.icm.edu.pl Forum Index epl.icm.edu.pl
Forum dyskusyjne o tematach związanych z e-Administracją i digitalizacją
 
 FAQFAQ   SearchSearch   MemberlistMemberlist   UsergroupsUsergroups   RegisterRegister 
 ProfileProfile   Log in to check your private messagesLog in to check your private messages   Log inLog in 

Polski czy angielski język tagów w standardzie metadanych

 
This forum is locked: you cannot post, reply to, or edit topics.   This topic is locked: you cannot edit posts or make replies.    epl.icm.edu.pl Forum Index -> Struktura metadanych 0.2
View previous topic :: View next topic  
Author Message
lklimek



Joined: 07 May 2006
Posts: 4

PostPosted: Sun May 07, 2006 9:16 pm    Post subject: Polski czy angielski język tagów w standardzie metadanych Reply with quote

Witam,

Przeglądając specyfikację standardu e-PL w wersji 0.1 zauważyłem, że wszystkie metadane są nazywane w języku polskim. Moim zdaniem nie jest to rozwiązanie optymalne. Sugerowałbym zastosowanie języka angielskiego.

Uzasadnienie jest bardzo proste. Język angielski jest de facto językiem międzynarodowym. W języku tym tworzonych jest wiele aplikacji i dokumentów, wykorzystują go powszechnie wykorzystywane formaty danych i normy (np. ostatnio ustandaryzowany format odt). Umożliwiłoby to:
* wymianę danych między podmiotami w różnych krajach;
* łatwiejsze dostosowanie formatu metadanych do innych międzynarodowych regulacji w tej kwestii (na etapie tworzenia standardu);
* implementację standardów przez podmioty w innych krajach.


Osobiście nie wyobrażam sobie implementowania formatu dokumentów zapisanych na przykład w języku francuskim, i myślę, że programiści z Francji czy Ukrainy mają podobne podejście do tego tematu.

Co więcej, typowa sekretarka w którymś z krajów UE, po otrzymaniu stworzonego zgodnie z e-PL dokumentu, będzie miała dużo większy problem w wypadku polskich metadanych niż w wypadku metadanych anglojęzycznych. Nie będzie mogła bowiem nawet stwierdzić, który z tagów zawiera nazwisko adresata, a który nadawcy.


Oczywiście, użytkownik końcowy powinien otrzymywać dokumenty w jego rodzimym języku. Moim zdaniem specyfikacja formatu powinna rozdzielać nazwę elementu zawartego w dokumencie XML (język angielski) od nazwy wyświetlanej użytkownikowi (język polski). Prosty przykład zawartości specyfikacji:
Code:

Nazwa metadanej [PL]: twórca
Nazwa metadanej [DE]: ...
Tag XML: creator


Oczywiście dodatkowe języki nie muszą być w chwili obecnej wyspecyfikowane; warto jednak zostawić możliwość rozszerzenia standardu o nowy język.

Wynikowy plik XML wyglądałby następująco:
Code:

<creator function="author">
   <subject><person fullname="Jan Styka" surname="Styka"></subject>
</creator>

Aplikacja wizualizująca tego typu dokument (np. przeglądarka archiwum) miałaby za zadanie przetłumaczenie (na podstawie ogólnie dostępnego słownika) angielskich nazw tagów na polskie nazwy metadanych.

Zwróćmy uwagę na jeszcze jedną zaletę tego typu podejścia: produkt polskiej firmy informatycznej korzystający z anglojęzycznych nazw metadanych może być z powodzeniem sprzedawany na całym świecie, co znacząco ułatwia wykorzystywanie standardu w praktyce. W wypadku polskich nazw metadanych firma jest zmuszona utworzyć odrębną wersję aplikacji na rynek międzynarodowy (lub stworzyć odpowiednie konwertery, tłumaczące dokumenty na inne języki).

Szczerze mówiąc nie potrafię wyobrazić sobie argumentów przeciw stosowaniu anglojęzycznych nazw tagów (pomijając kwestie polityczne).


ps. Na tym forum nie udało mi się znaleźć przekonującego uzasadnienia korzystania z języka polskiego, więc pozwoliłem sobie stworzyć nowy wątek. Jeśli temat był już poruszany, proszę o wskazanie odpowiedniego wątku.
Back to top
View user's profile Send private message
kschmidt
Site Admin


Joined: 20 Mar 2005
Posts: 153
Location: NDAP

PostPosted: Mon May 08, 2006 11:45 am    Post subject: metadane "po angielsku czy po polsku"? Reply with quote

Temat bardzo ciekawy i jak mi się wydaje wart niejednego komentarza. Jak zauważył sam autor wiadomości nie widzi on przeszkód "przeciw stosowaniu anglojęzycznych nazw tagów (pomijając kwestie polityczne)"
Otóz wydaje mi się że właśnie kwestie polityczne mogą tu przeważyć. Skoro można zrobić oprogramowanie które "przekłada" angielskie nazwy tagów na polskie to można też odwrotnie tj "tłumaczyć z polskiego na angielski". Wstawiłem tu cudzysłów ponieważ dla komputera to zupełnie wszystko jedno jak się znacznik nazywa zob. komentarz do wersji roboczej struktura_szkic_02 projektu rozporządzenia. http://epl.icm.edu.pl/forum/viewtopic.php?p=253#253
Proszę zwrócić uwagę że i Świat i UE "mają zamiar" się dogadać w kwestii standaryzacji metadanych już od lat i jakoś mało z tego wychodzi. Każdy ciągnie w swoją stronę i z reguły dyskusja o interoperacyjności sprowadza się do tego czy dokument elektroniczny w ogóle da się przeczytać bez konieczności zakupu komercyjnego oprogramowania. A to żeby jeszcze niósł ze sobą (czy "w sobie"?) standardowe metadane pokazujące kontekst jago wytworzenia to już... ho ho ho! Problem ten często próbuje się rozwiązać planując JEDEN WIELKI SYSTEM do wymiany dokumentów ... co jak wiadomo z praktyki i tak nie wypali bo obejmie tylko część podmiotów a reszta i tak będzie słać pisma "na piśmie".
Jeśli przekonałem do tego że standard EUnijny albo światowy nie zostanie uzgodniony w najbliższym czasie to znaczy że i tak trzeba będzie ogłaszać mapowanie "naszych" tagów na inne (np na Dublin Core) - i już będzie światu wiadomo co jest czym. Tak jest przecież (albo powinno być) z każdym standardem. Jeśli więc jakaś firma zrobi oprogramowanie dostosowane do polskiego standardu to i tak jeśli Unia coś w końcu uzgodni będzie musiała "tłumaczyć" to na inną strukturę. Zapewne nie obejdzie się w tym przypadku bez uproszczenia owej struktury w kierunku łaczenia ze sobą danych z poszczególnych elementów. Ale to juz inny temat...
Przyczyny merytoryczne nie są więc chyba przeszkodą.

Zostają więc przyczyny polityczne i do tych między innymi zaliczyłbym możliwość łatwego odczytania przez świat że "tworca" to "creator" a "tematyka:miejsce" to "coverage:spatial" itd.
Wpisywanie nazw angielskich do polskiego rozporządzenia (choćby tylko do XSD) jest jednak dla mnie trudne do zaakceptowania. To trochę tak jakbyśmy na naszych formularzach PIT zamiast "imię i nazwisko" pisali "name & surname"... i choć to byłoby ukryte w tagach XML (jak dziś wiadomości poczty elektronicznej) to jakoś mi nieprzyjemnie. Poszukałem w bazie danych aktów prawnych i nie znalazłem nazw angielskich. Podejście do struktury dokumentu elektronicznego jest albo typowo "bazodanowe" tj nazywa sie pola danych dla konkretnych baz danych w sposób zrozumiały tylko dla tych co mają "deszyfrator" (np. <nrEwT> <nrRejDat> <zNrDokTo> czy <RPWŁ> albo <DOS> albo po prostu po polsku. Przy okazji wyjśniam że <DOS> to mniej więcej to samo co <zNrDokTo> tylko że w innym rozporządzeniu Smile
Wyjątkiem od ww. zasad polskości jest tylko podpis elektroniczny.

Jeżeli zaś swiat miałby się zachwycić polskim projektem - a będzie mógł zrobić to tylko wtedy gdy go zrozumie. Hmm... Myślę że świat ma to gdzieś i nie musimy go na siłę uszczęśliwiać.

Przy okazji chciałem zwrócić uwagę na temat na forum http://epl.icm.edu.pl/forum/viewtopic.php?t=78 Otóż na razie problemem jest istnienie w ogóle jakichkolwiek nazw znaczników (tagów) w rozporządzeniu.

_________________
--
Kazimierz Schmidt
Back to top
View user's profile Send private message Send e-mail
lklimek



Joined: 07 May 2006
Posts: 4

PostPosted: Wed May 10, 2006 9:29 am    Post subject: Re: metadane "po angielsku czy po polsku"? Reply with quote

kschmidt wrote:

Wyjątkiem od ww. zasad polskości jest tylko podpis elektroniczny.

Owszem. Chciałbym jednak zauważyć, że np. element certyfikat podany w projekcie metadanych jest niezgodny ze standardem XMLDSIG/XAdES, wymaganym przez uregulowania związane z podpisem elektronicznym (np. elektroniczna skrzynka podawcza). Tworzy się w ten sposób kolejna niespójność nie tylko z normami międzynarodowymi, ale i z naszym własnym ustawodawstwem. Podobnie wygląda sytuacja w wypadku innych podobnych elementów. W praktyce oznacza to konieczność implementacji przez każdego, kto chce się stosować do przedstawionych metadanych, własnego formatu podpisu, niezgodnego z żadnym światowym standardem.

kschmidt wrote:

Jeżeli zaś swiat miałby się zachwycić polskim projektem - a będzie mógł zrobić to tylko wtedy gdy go zrozumie. Hmm... Myślę że świat ma to gdzieś i nie musimy go na siłę uszczęśliwiać.

Ja patrzę z punktu widzenia praktyka. Swiat nie ma przyjąć naszego formatu, wystarczy, że go zrozumie. Nie chodzi tu o wymuszenie jakiejś standaryzacji międzynarodowej, ale o ułatwienia życia obywatelom UE (tu: programistom z firm w UE).

kschmidt wrote:

Przy okazji chciałem zwrócić uwagę na temat na forum http://epl.icm.edu.pl/forum/viewtopic.php?t=78 Otóż na razie problemem jest istnienie w ogóle jakichkolwiek nazw znaczników (tagów) w rozporządzeniu.

Osobiście zgadzam się z opiniami przedstawionymi w tym wątku - rozporządzenia powinny być precyzyjne. Inaczej znów dojdzie do sytuacji podobnej do tej, z jaką mamy do czynienia w wypadku podpisu elektronicznego - ustawa dopuszcza 3 standardy, a mamy 4 nie współpracujące ze sobą formaty podpisu.

Ponadto chciałbym zwrócić uwagę na stanowisko ISOC Polska w sprawie e-podpisu, gdzie wyraźnie rekomendowane jest ujednolicenie formatu podpisu w kierunku podpisu XMLowego, a dokładniej formatu XAdES (dokuemnt w formacie rtf). W tym kontekście tworzenie kolejnego nieprecyzyjnego rozporządzenia nie zostanie moim zdaniem pozytywnie odebrane.

Pozdrawiam.
Back to top
View user's profile Send private message
kschmidt
Site Admin


Joined: 20 Mar 2005
Posts: 153
Location: NDAP

PostPosted: Wed May 10, 2006 11:03 am    Post subject: Re: metadane "po angielsku czy po polsku"? Reply with quote

lklimek wrote:
Ponadto chciałbym zwrócić uwagę na stanowisko ISOC Polska w sprawie e-podpisu, gdzie wyraźnie rekomendowane jest ujednolicenie formatu podpisu w kierunku podpisu XMLowego, a dokładniej formatu XAdES

Przyznam się tutaj, że sam nie jestem zwolennikiem dodawania podpisu elektronicznego do ogólnego standardu metadanych. I najchętniej w ogóle bym ten akurat element... wyrzucił ponieważ może on być uregulowany w innych przepisach. Nie wnosi on także jakiejś istotnej wartości informacyjno-wyszukiwawczej - zwłaszcza w kontekście historycznym (długoterminowego przechowywania). Podpis znalazł się w propozycji ponieważ trzeba zwrócić uwagę że coś takiego jest i zastanowić się czy ma być uznany za "niezbędny element struktury" czy nie. Kłopoty z podpisem widać wyraźnie w przypadku eGMS na którym w znacznej mierze opiera się propozycja. Otóż w wersji 3.0 zob. http://www.govtalk.gov.uk/schemasstandards/metadata.asp element "digital signature") definicji podpisu ani celu jego wyodrębnienia, ani przykładów nie ma. Opisany jest tak jako "To be decided". I tak samo jest w poprzednich wersjach. Dodano jeszcze że jest opcjonalny i że:
"The National Archives will examine what metadata is likely to be created by digital signature technology and how far it is of relevance/use in records management when the adoption of this technology is further advanced in the UK Government. Changes will be made to this element when this work is completed"

Sam też "nie czuję" za dobrze podpisu elektronicznego Sad Tak więc nic mi nie pozostaje jak zgodzić się z tymi co wiedzą na ten temat więcej ode mnie. Liczę (nieskromnie może), że pojawi się na naszym forum propozycja wykreślenia elementów Certyfikat i Podpis albo takiego ich opisania aby było ... jak nalezy. Liczę też na to że w tzw. konsultacjach społecznych (po ogłoszeniu projektu w BIP-ie MSWiA) zostaną oficjalnie zaproponowane odpowiednie zmiany.
Co do języka polskiego w "tagach" (jeżeli XSD w ogóle będzie załączony do rozporządzenia!) to myślę, że w rozporządzeniu być musi - jak pisałem z przyczyn politycznych. Co innego gdyby rozporządzenie odsyłało, że ktoś ma określić i ogłosić np. w BIPie wzorzec technicznego sposobu zapisu zgodny ze strukturą określoną w rozporządzeniu. Może byłaby to ciekawa droga do dojścia do porozumienia z przeciwnikami załącznika XMLowego bezpośrenio w rozporządzeniu. Nie wiem czy jednak takie rozwiązanie (subdelegacja!) jest możliwe z czysto legislacyjnego punktu widzenia, ponieważ ustawa wyraźnie wskazuje kto ma zrobić rozporządzenie. A skoro tak to chyba MSWiA nie może delegować dalej, narzuconych mu ustawą uprawnień.
Z drugiej strony takie niekonsekwencje już w polskim prawie są. Z ostatnich takich propozycji jest też idea aby MSWiA ogłaszał w BIPie "zasady tworzenia wyróżników określających szczegółowo zakres użytkowy dokumentów elektronicznych... " zamiast podać te zasady w rozporządzeniu (zob. na tym forum: http://epl.icm.edu.pl/forum/viewtopic.php?t=85 )

_________________
--
Kazimierz Schmidt
Back to top
View user's profile Send private message Send e-mail
AO



Joined: 01 Apr 2005
Posts: 14
Location: NDAP

PostPosted: Tue Jun 06, 2006 1:32 pm    Post subject: Re:Polski czy angielski język tagów w standardzie metadanych Reply with quote

Gdyby tytuł był bardziej dokładny i brzmiał: "Polski czy angielski język tagów w POLSKIM standardzie metadanych" zapewne odpowiedź byłaby znacznie prostsza.
Osobiście uważam, że stopień trudności w zmapowaniu tagów w języku polskim na inne języki jest dość nikły, a w przypadku języka angielskiego tłumaczenie mógłby wykonać uczeń szkoły średniej.
Inną zaletą tagów w języku polskim jest łatwiejsza analiza xml-i dla polskich autorów przyszłych programów, które zawojują Europę i Świat. Nie ma też konieczności "slangowania" np. recipient Kowalski, tworzenia i rozwijania pidgin Polish w behavior i mentality (hehe) programistów. Może to i jest polityczne ale językoznawcy by się obrazili na taki zarzut.
Krótko mówiąc, tam gdzie niema przymusu odchodzenia od języka narodowego nie ma powodu aby to robić. Polskie tagi to coś innego niż polskie polecenia SQL-a.

Adam
Back to top
View user's profile Send private message
Display posts from previous:   
This forum is locked: you cannot post, reply to, or edit topics.   This topic is locked: you cannot edit posts or make replies.    epl.icm.edu.pl Forum Index -> Struktura metadanych 0.2 All times are GMT + 1 Hour
Page 1 of 1

 
Jump to:  
You cannot post new topics in this forum
You cannot reply to topics in this forum
You cannot edit your posts in this forum
You cannot delete your posts in this forum
You cannot vote in polls in this forum
You cannot attach files in this forum
You can download files in this forum


Powered by phpBB © 2001, 2005 phpBB Group