다이어크리팈

From Hidden Wiki
Jump to navigation Jump to search

[include(틀:회원수정)] [목차]

개요

Léon의 e 위에 있는 부호와 같이, 글을 쓸 때 글자의 위나 아래에 찍는 부호. 한 문자가 여러 가지로 읽히는 유럽 등지의 언어에서 많이 볼 수 있다. 특정 문자의 정확한 발음을 표기하기 위해 찍기도 하고, 동철이의어를 구분할 때 찍기도 한다. 악센트, 악상 등으로 일컫기도 한다.

다이어크리팈, diacritic, 다이어크리틱

Diacritics의 기원은 그리스 문자이다. 그리스 문자는 자연발생한 문자이고 고대 그리스는 통일된 국가가 없이 도시마다 서로 다른 나라처럼 살아왔기 때문에 문자도 각 도시 각 지방마다 모양새가 조금씩 다르고 글자가 나타내는 발음도 조금씩 달랐는데, 기원전 4세기경에 그리스 문자의 표준형이 동부의 그것으로 통일되어 가면서 한 문자가 둘 이상의 발음을 나타내게 되었고, 이를 구분하기 위해 도입한 것이 diacritics이다.

유럽이 아니더라도 라틴 문자, 키릴 문자를 자기네 언어의 문자 표기로 받아들인 지역에서는 종종 볼 수 있다. 베트남이 그 예로, 베트남은 원래 한자쯔놈을 썼다가 프랑스 식민 지배 시절부터 라틴 문자를 토대로 한 쯔꾸옥응으를 채택했는데, 베트남어 성조 6개를 diacritic으로 표기하고 그와는 별도로 몇몇 자음/모음을 diacritic으로 구분하기 때문에(예: e와 ê는 다른 모음임) 현대 베트남어를 보면 온통 diacritic 범벅이다. 중국은 라틴 문자를 자국 언어의 공식 문자로 받아들이지는 않았으나, 한어병음에서 표준중국어성조 4개를 반영하기 위해 diacritic을 쓰고, u, e와는 다른 모음을 표기하기 위해 ü, ê를 쓴다. 반면 유럽 언어 중에서도 라틴어영어처럼 diacritic이 거의 안 쓰이는 언어가 몇 개 있고, 범위를 지구 전체로 넓혀 보면 마인어스와힐리어 등 diacritic을 전혀 쓰지 않는 언어도 있다. 한국어도 한 때 로마자 표기를 매큔-라이샤워 표기법으로 사용할 때 쓰기도 했다.

소문자 i나 j의 위에 diacritic이 붙는 경우, i와 j의 점은 탈락한다(예: i → í, î, ī, ĭ / j → ĵ). diacritic이 소문자 i나 j의 밑에 붙을 때는 점이 그대로 유지된다(예: į, ḭ 등). 참고로 유니코드에는 ı(U+0131, 점이 없는 소문자 i, 터키어 등에서 사용), ȷ(U+0237, 점이 없는 소문자 j)도 있다. 주의할 점은 유니코드에서 소문자 i와 j의 위에 combining diacritic을 붙일 때는 ı(U+0131)와 ȷ(U+0237)가 아니라 그냥 ASCII의 i(U+0069)와 j(U+006A)를 써야 한다는 것이다(참고: [FAQ 중 "Should I use the combining diacritic over U+0131 LATIN SMALL LETTER DOTLESS I, or should I use U+0069 LATIN SMALL LETTER I?"], [Core Specification의 "Diacritics on i and j"]). 소문자 i나 j의 뒤에 글자 위에 붙는 combining diacritic이 뒤따르면 글꼴이 알아서 i와 j의 점을 제거하게 되어 있다.

diacritic이 포함된 철자를 원래 철자와 다른 것으로 보는가 같은 것으로 보는가는 언어에 따라 다르다. 프랑스어, 이탈리아어, 포르투갈어는 같은 것으로 보고, 스페인어는 N/n과 Ñ/ñ을 구분하는 것을 제외하고는 같은 것으로 보고 있으며, 독일어, 루마니아어는 다른 것으로 본다.

diacritic 하나 차이로 전혀 다른 지명이 되는 경우도 있다. 크로아티아에는 [će]가 있고 슬로베니아에는 [če]가 있다.

간혹 diacritic을 한국어에서 '발음 구별 기호/부호'라고 번역해 부르는 경우도 있는데, diacritic이 발음에는 영향을 주지 않고 동철이의어를 구분하기 위해서 쓰이는 경우도 있으므로(예: 프랑스어의 ou와 où. 각각 영어의 or와 where에 해당되며, 발음은 둘 다 똑같이 [u]이다) 이렇게 번역해 부르는 것은 적절하지 않다.

언어별 확장 라틴 문자 목록 문서도 참고할 것.

한국어 윈도우에서 일본어 가나와 함께 cue+wav 기반의 CD 이미지 파일 깨짐의 원인이 되기도 한다. 이 경우 diacritic을 뺀 라틴 문자로 바꿔 줘야 올바르게 인식한다. --유니코드는 이럴 때 쓰라고 있는 건데...--

종류

acute (◌́)

{{{+3 É é}}}

grave와는 다르니 주의.

많이 쓰이는 부호 중 하나이다.

보통 모음에 붙었을 때에는 강세를 표시하며(그리스어, 스페인어 등), 때때로 장음을 표시할 때(체코어, 헝가리어 등)도 쓰인다. 중국어 한어병음베트남어에서는 올라가는 성조(2성)를 나타낼 때 쓰인다.

몇몇 언어에서는 서로 다른 모음을 구별하기 위해 쓰이는데, 프랑스어에서는 [ə]와 [e]를 구분하기 위해 이 부호를 e에 붙여(é) [e]를 나타낸다. 반대로 자음을 구별하기 위해서도 쓰이는데, 폴란드어 같은 슬라브어의 경우 구개음화되는 자음에 쓰인다. 가령 폴란드어 sześć는 '셰스츠'가 아니라 '셰시치'처럼 읽는다. 둘이 섞인 경우로는 투르크멘어에서는 ý는 영어 y와 거의 유사한 자음이지만, y는 한국어 '으'처럼 발음되는 모음이다.

double acute (◌̋)

{{{+3 Ő ő}}}

헝가리어에서 o와 u의 위에 붙여(ő, ű) 각각 ö와 ü의 장음을 나타낸다.

grave (◌̀)

{{{+3 È è}}}

acute와는 다르니 주의.

거의 모음에 붙으며, 몰타어이탈리아어 등에서는 강세가 있는 모음을 나타낼 때 쓰인다. 베트남어나 중국어 한어병음에서는 내려가는 성조(4성)를 표시할 때 쓰인다.

프랑스어에서는 모음이나 동철이의어를 구별하기 위해서도 쓰인다. 포르투갈어에서는 전치사 a와 여성 정관사 a(s)의 결합형인 à(s)에서만 쓰인다.

글자 `는 키보드로 입력할 수 있지만 잘 쓰이지 않는다.

circumflex (◌̂)

{{{+3 Ê ê}}}

역시 많이 쓰이는 부호이다.

원래 그리스어에서 áà → â 이런 식으로 줄여 만든 부호이다. 다만 현재 그리스어에서 해당 글자는 쓰이지 않는다.

베트남어나 루마니아어, 슬로바키아어 등에서 모음을 구별하기 위해 쓰인다. 가령 루마니아어 a는 그냥 a 발음이지만 â는 [ɨ] 발음이다.

포르투갈어 등에서는 강세가 있는 모음에 쓰이고(포르투갈어의 경우 acute 또한 쓰인다), 웨일스어터키어(경우에 따라서)의 경우 장음에 이 부호를 쓴다. 터키어에서는 구개음화를 표시하기 위해 쓰이기도 한다(가령 kâğıt은 '카읏'이 아니라 '캬읏'처럼 읽는다).

에스페란토에서는 차펠로나 수페르시그노라 부르며 자음들을 구별하기 위해 쓰이지만, 컴퓨터로 입력하기 어렵기 때문에 x로 대체해 쓰기도 한다(예: ĉ → cx, ĝ → gx).

프랑스어에서는 일반적으로 한 단어 안에서 모음과 자음 사이에 s가 있었으나 지금은 그 s가 묵음이 된 경우 s 대신 이 부호를 사용한다(예: hôtel ← hostel(호텔), forêt ← forest()).[* '일반적으로' s가 있다가 사라진 경우에 circumflex가 붙는다. 좀 더 깊게 파고들어가면 탈락한 글자가 s가 아닌 경우도 있고(예: âge ← aage, sûr ← seur), 심지어 아무 글자도 탈락되지 않았는데도 circumflex가 붙은 경우도 있다(예: suprême, connaître).] 로피탈의 정리가 l'Hôpital로 적히기도 하고 l'Hospital로 적히기도 하는 것도 이 변화와 관련이 있다.[* 참고로 현대의 프랑스어권 성씨 중에는 circumflex를 쓰지 않고 철자상으로 s를 그대로 남겨 둔 경우도 있다(물론 이렇게 적어도 발음상으로는 s가 여전히 묵음이다). 기 들릴의 성씨 Delisle은 어원이 de l'Île (of/from the Island)이지만 is를 î로 쓰지 않는다.]

프랑스어의 1990년 철자법 개정에서는 i와 u 위의 circumflex를 대부분[* circumflex를 없앴을 때 다른 단어와 겹치는 경우는 circumflex를 그대로 유지한다(예: croit/croît, cru/crû, du/dû, jeune/jeûne, sur/sûr 등). 그래서 '모두'가 아니라 '대부분'이다.] 떼는 쪽으로 바꾸었는데(예: août → aout, connaître → connaitre), 저 개정된 철자법을 사실상 아무도 따르지 않는다(...).

중국어 한어병음에서는 감탄사 중 하나인 欸를 ê로 표기한다. 이는 한국어 '에'에 가까운 발음으로, e가 단독으로 쓰이면 '어'에 가까운 발음을 나타내기 때문에 둘을 구분해주기 위한 것이다.

caron/háček (◌̌)

{{{+3 Ě ě}}}

breve와는 다르니 주의.

주로 체코어, 라트비아어 등의 슬라브어나 발트어 등에서 사용되며, 구개음화된 자음을 표시한다. 폴란드어처럼 일부 언어에서는 acute를 구개음화되는 자음을 표시하는 데 쓰기도 하는데, 이 경우 acute는 치경구개음을, caron은 후치경음이나 권설음을 나타내는 데 쓰는 경우가 많다.

d, L/l, t처럼 세로로 긴 글자에 붙일 때(ď, Ľ/ľ, ť)에는 d’, L’/l’, t’처럼 쓰기도 한다.

중국어 한어병음에서는 내려갔다 올라오는 성조(3성)를 나타낼 때 쓰인다. 뒤에 1,2,4성이 오는 단어의 경우 앞에 3성은 내려가는 부분만 발음하고(반3성) 뒤에 3성이 연속으로 오면 앞에 3성은 2성으로 발음하되 표기는 그대로 한다.

참고로 영어 명칭 caron의 어원은 불분명하다. 어떻게 해서 이런 이름이 붙었는지 아무도 명확한 답을 모른다.

macron (◌̄)

{{{+3 Ē ē}}}

~~이 분과는 관계 없다~~ 장음을 나타낸다. breve와는 반대이다.

일본어헵번식 로마자 표기법이나 라트비아어, 폴리네시아의 언어들 등에서 사용한다. 중국어 한어병음에서는 평탄한 성조(1성)를 나타낼 때 쓰인다.

라틴어에서도 자주 쓰이는데, 보통은 생략되곤 하지만 macron은 강세를 정확하게 해주고 격변화 구별에도 쓰이는 등 하나의 중요한 문법적 요소이므로 같이 외워두는 게 좋다.

breve (◌̆)

{{{+3 Ĕ ĕ}}}

caron/háček와는 다르니 주의.

macron과는 반대이다.

일반적으로는 짧은 모음을 나타내며(베트남어 등), 주로 키릴 문자를 사용하는 언어에서는 반모음을 나타낸다. 에스페란토에서도 유일하게 ŭ가 이 부호를 사용한다.

터키어 등에서는 g 위에 breve를 붙여(ğ) 특정 방언에서만 발음되는 g를 나타내며, 다른 튀르크어에서는 보통 gh 발음을 표기할 때 쓴다.

루마니아어에서는 [ə]와 [a]를 구별하기 위해 사용된다. 키릴 문자의 경우 러시아어에서는 И/и과 Й/й가 구분되어 전자가 /i/, 후자가 반모음 /i/(독일어의 j 발음과 같은 발음) 발음을 나타내며, 추바시어에서도 [a]와 [ə], [ɛ]와 [ɘ]를 breve로 구분한다.

한국어 로마자 표기법 중 매큔-라이샤워 표기법에서는 ㅓ와 ㅡ를 이 기호를 사용해 각각 ŏ와 ŭ로 쓴다. ㅓ, ㅡ는 ㅗ(o), ㅜ(u)의 평순 모음에 해당하므로 이 표기법에서 breve는 평순 모음화를 나타내는 셈이 된다.

diaeresis/trema, umlaut (◌̈)

{{{+3 Ë ë}}}

diaeresis/trema와 umlaut는 어원적으로 서로 다른 부호이고 둘의 기능도 전혀 다르나, 현대에는 모양이 같아졌다. 유니코드에서도 diaeresis/trema와 umlaut를 구분하지 않는다. 스페인어 pingüino의 ü(u + diaeresis)나 독일어 Glück의 ü(u + umlaut)나 똑같이 U+00FC이다.

라틴 문자를 사용하는 언어권에서는 보통 ä나 ö 위에 붙은 것은 umlaut, ë나 ï나 ÿ[* ÿ는 빈도가 낮으나 프랑스어에서 일부 고유 명사에 간혹 쓰인다(예: [[1]], [[2]]). 발음은 ï와 같다.] 위에 붙은 것은 diaeresis이며, ü 위에 붙은 것은 언어에 따라 umlaut일 수도 있고 diaeresis일 수도 있다. Ü 문서도 참고하면 좋다.

diaeresis/trema

영어(자주 생략되는 편)나 그리스어, 프랑스어 등 많은 언어에서 digraph를 분리할 때 쓰인다. 대표적으로 이 부호가 쓰인 예시가 국명인 아이티(Haïti). 한국어의 매큔-라이샤워 표기법에서도 ㅐ/ㅚ 발음과 ㅏ에/ㅗ에 발음을 구분하기 위해 이 부호를 쓴다(예: mulkae 물개, mulkaë 물가).

또한 영어에서, 어말의 e가 발음됨을 표시하는 용도로도 쓰인다. 에밀리 브론테, 샬럿 브론테의 Brontë가 그 예. e의 발음을 살려 브론티(/ˈbrɒnti/)로 읽는 게 원칙이지만, 영어권에서도 브론테(/ˈbrɒnteɪ/)로 읽는 경우가 흔한 듯.

스페인어에서 g는 e나 i 앞에 올 때 ㅎ처럼(정확히는 [x]로) 발음되기 때문에 그냥 [ɡe], [ɡi] 발음은 gue, gui로 표기한다. 따라서 실제 [ɡwe], [ɡwi] 발음을 쓸 때에는 이 부호를 u 위에 붙여서 güe, güi로 표기한다(예: vergüenza, pingüino).

프랑스어에도 ge, gi, gue, gui와 관련해서 같은 문제가 있는데(다만 ge, gi의 g는 [x]가 아니라 [ʒ]로 발음되고, diaeresis로 나타내는 발음이 [w]가 아니라 [y] 또는 [ɥ]임), 이상하게 diaeresis를 u 위에 찍는 게 아니라 뒤따르는 e나 i의 위에 찍는다(예: aiguë [ɛɡy], ambiguïté [ɑ̃biɡɥite]). 논리적으로 생각해 보면 스페인어에서처럼 u 위에 붙는 게 맞는데 왜 프랑스어에서는 저렇게 쓰는지 알 수 없다. 실제로 프랑스어의 ambiguïté에 해당되는 스페인어 단어는 ambigüedad이다. 1990년의 프랑스어 철자법 개정에서 u 위에 붙이도록 바꾸기는 했는데(예: aigüe, ambigüité), 저 개정된 철자법을 사실상 아무도 따르지 않는다(...).

umlaut

독일어스웨덴어, 터키어, 핀란드어, 에스토니아어, 헝가리어 등 많은 언어에서 이 부호는 전설모음화된 모음을 표시할 때 쓰이며, 이때는 보통 독일어에서의 명칭을 따 '움라우트'라 부른다. 그리고 움라우트를 사용하는 많은 언어가 전부는 아니지만 모음조화 현상을 가지고 있다. 이때 쓰이는 부호는 위에서 음절을 나눌 때 쓰이는 부호와는 상관없는 부호로, 원래 a나 o, u 등에 작게 e를 붙인 것을 간략화한 것이다. 이 영향으로 독일어에서는 종종 움라우트 대신 e를 쓰기도 한다(예: Raeder, Goethe 등). 때문에 독일어 움라우트의 대체 표기는 모음 + e다. 그러나 여기에도 예외는 있어서 모음 + e가 왔다고 해서 무조건 움라우트가 붙은 모음으로 읽히는 것은 아니다. 강변의 땅을 뜻하는 Aue의 발음은 Aü와 동일하지 않고 u와 e를 따로 읽는다.

중국어 한어병음에도 ü가 사용되며, 성조 부호까지 붙이면 ǖ, ǘ, ǚ, ǜ가 된다. 그러나 성모가 j, q, x이거나 없어서 앞에 y를 붙이는 경우 위에 두 점을 생략하여 표기하니 발음할 때 주의해야 한다.

기타

알바니아어 등에서는 e 위에 이 부호를 붙여(ë) [ə] 발음을 나타낸다.

러시아어에서는 ё(요)에 쓰이는데, 원래는 그냥 е(예)로 썼었다. 그러다가 구분하기 위하여 이 부호를 찍었다. 그런데 사실 지금도 ё는 외국인을 위한 교재나 교과서, TV 뉴스 등을 제외하면 거의 안 쓰이며, 거의 е로 쓴다. 컴퓨터 자판상으로도 ё는 좌측 상단 자리에 뚝 떨어져 있으며, 모바일 자판은 е를 꾹 눌러야만 나오게끔 되어 있는 경우가 많다.

우크라이나어에서는 yi와 i를 구분하기 위해 i는 і, yi는 ї로 표기한다.

크툴루 신화에서 자주 등장하는 영창 중 "Iä!"로 표기되는 것이 있다. 하워드 필립스 러브크래프트의 원작에는 명시되어 있지만, 후대에는 ~~키보드로 치기 번거로워서 그런지~~ 보통 생략된다.

~~이모티콘으로 쓸 수도 있다~~([[3]])[* 여기서 나온 '우무라우트'는 움라우트(umlaut, ¨)의 가타카나 표기 ウムラウト(우무라우토)를 번역하는 과정에서 생긴 오류로 보인다. 한국어로 쓰려면 '움라우트'라고 쓰는 게 원칙.]

cedilla/cédille (◌̧)

{{{+3 Ȩ ȩ}}}

ogonek와는 다르니 주의.

로망스어파 언어들에서 보통 쓰이는데, 스페인어에서 cz를 줄여 ç로 표기한 것이 시초이다. 현재 스페인어에서는 쓰이지 않으나, 같은 로망스어 중 카탈루냐어, 포르투갈어프랑스어 등에서는 c가 a나 o 앞에서 [s] 발음이 날 때 c에 cedilla를 붙여서 [s]로 발음하도록 명시한다(c 다음에 a나 o가 오면 원래 [k]로 발음되므로).

터키어 등의 (주로) 튀르크어에서는 ş, ç은 [ʃ], [tʃ]로 발음되는 독립된 글자이다.

comma below (◌̦)

{{{+3 Ș ș}}}

라트비아어와 루마니아어의 일부 글자에는 comma가 붙으나, 기술적인 이유로 인해서 cedilla와 혼용되기도 한다.

라트비아어에서는 g, k, l, n 등에 붙어(ģ, ķ, ļ, ņ) 구개음화된 자음을 나타낸다. ģ의 경우 글자가 아래쪽으로 내려가기 때문에 글자 위에 뒤집어진 형태의 comma가 붙는다. 유니코드가 표준화되기 이전에 문자를 전산화할 때 이 문자들이 cedilla로 등록되었기 때문에, 유니코드 상에서도 이들 문자의 이름은 cedilla지만 comma 형태의 문자를 사용한다.

루마니아어에서는 [ʃ], [ts] 발음을 s와 t 밑에 comma(,)를 찍어 표시한다(ș, ț). 의외로 유니코드 표준에는 1999년 발표된 3.0이 되어서야 들어왔기 때문에 컴퓨터에서 comma가 붙은 ș와 ț 대신 cedilla가 붙은 ş와 ţ가 사용된 적이 있었다. t 밑에 cedilla/comma가 붙은 글자는 루마니아어에서만 사용되었기 때문에(s+cedilla는 터키어 등에서 쓰인다) t+cedilla 코드 포인트에 t+comma를 집어넣은 글꼴도 있었다. 윈도우 XP는 출시 당시에는 comma가 붙은 ș와 ț를 올바르게 입력할 수 없었고, 업데이트를 통해서 이 문자들을 지원하게 되었다. 윈도우 비스타 이후부터 이 글자들을 정상적으로 표시할 수 있게 됐고 루마니아어 키보드 레이아웃에서 입력할 수 있게 됐다. 그래서 아직까지도 이 두 글자들이 혼용되는 것을 볼 수 있다.

ogonek (◌̨)

{{{+3 Ę ę}}}

cedilla와는 다르니 주의.

폴란드어에서 사용되며, 이때는 비음을 나타낸다. 대표적인 예시가 Lech Wałęsa. 많은 아메리카 원주민 언어에 존재하는 비음을 표기할 때에도 이 부호를 사용한다. 리투아니아어에는 비음이 존재했고 ogonek(리투아니아어로는 노시네 nosinė)로 이를 표기했으나, 현재 리투아니아어에서는 비음이 장음으로 대체되었기 때문에 장음을 나타내는 부호가 되었다.

tilde (◌̃)

{{{+3 Ẽ ẽ}}}

대표적으로 포르투갈어에서 쓰인다. 포르투갈어에서는 ogonek처럼 비음을 나타내는 글자이며, 과라니어에서도 비음을 나타낼 때 이 글자를 쓴다.

스페인어 등에서는 n 위에 붙여(ñ) [ɲ] 발음을 나타내며, 베트남어에서는 성조를 나타낸다.

에스토니아어에서 õ는 모음 [ɤ]('어'와 '으'의 중간쯤 되는 발음)을 표시할 때 쓰이는 독립된 글자이다.

upper ring (◌̊)

{{{+3 Å å}}}

덴마크어, 스웨덴어, 노르웨이어, 체코어에서 쓰인다. 덴마크어와 스웨덴어, 노르웨이어에서는 å가 존재하며 단음과 장음으로 발음될 수 있는데, 공통적으로 단음으로는 /ɔ/로 발음되고 장음은 덴마크어와 노르웨이어에서는 /ɔː/, 스웨덴어에서는 /oː/로 발음된다.

체코어에서는 ů가 존재한다. u의 장음 형태로 ú와 같은 발음이지만 ů는 단어 맨 앞에서 쓰일 수 없고 ú는 대부분 단어를 이루는 어근 첫머리에만 온다.

그 외에는 러시아 제국이 보급한 리투아니아어 키릴 문자에서도 uo를 나타내기 위해 У̊ / у̊가 쓰인 바 있다.

섭씨를 나타내는 ℃와 화씨를 나타내는 ℉의 동그라미도 upper ring으로 간주된다.

horn (◌̛)

{{{+3 Ơ ơ}}}

베트남어에서 o와 u의 오른쪽 위에 붙여(ơ, ư) 각각 [əː]와 [ɨ]를 나타낸다.

hook above (◌̉)

{{{+3 Ẻ ẻ}}}

베트남어에서 부드럽게 내려갔다가 다시 올라오는 성조를 나타낼 때 쓴다.

dot below (◌̣)

{{{+3 Ẹ ẹ}}}

베트남어에서 음을 짧게 떨어뜨리는 성조를 나타낼 때 쓴다.

산스크리트어 로마자 표기법 IAST에서는 권설음을 표기할 때 사용한다.

기타

영어 위키백과에서는 아랍 문자히브리 문자의 모음부호, 아부기다 문자에서 내재 모음이 아닌 다른 모음을 나타내주기 위해 덧붙이는 기호나 일본어의 탁음 기호(゛), 반탁음 기호(゜)같은 것도 diacritics라 한다.

분류:언어분류:문장 부호