Русские вычислители

Информация о пользователе

Привет, Гость! Войдите или зарегистрируйтесь.


Вы здесь » Русские вычислители » Словесность » Словарь терминов в информатике


Словарь терминов в информатике

Сообщений 101 страница 200 из 227

101

Но система известна! Например, черный ящик. Неизвестно именно устройство системы.

Да, это трудно. Вы не улавливаете противоречивости и перегруженности в этих трех предложениях?
Что значит "известна"? Вы дали название устройству? Первое - это очень сомнительное, смутное заявление.

Они же совершенно точно передаются:
Например, известный черный ящик. Неизвестно именно его устройство.
Слово "система" - по-прежнему лишнее.
Например, Вы не можете сказать "известно неизвестное устройство" и это заставляет разум искать обход для простой подстановки, а первое слово просто лишнее.
Почему Вы считаете, будто следует заменять существительное а не глагол?
Повторю, то в чем Вы ищите сокровенный смысл - лишь игра слов.

Скажем так: экономисты такое, конечно, поймут (это их устойчивый язык с частыми переливаниями), а большинство народа будет подташнивать.
В продажах это бывает весьма успешно - навесить обертку и приписать новые свойства=)
Но не думаю, что нужно объяснять Вам про "избыточность кода".

Под словом устройство я понимаю существительное, предмет. А не его глагольную и/или отглагольную форму.

И зря.  Государственное устройство - это что за предмет?
А "финансовая система", "образовательная система" - все это результат халтуры вместо перевода.

Тоже самое и с терапевтом. Которого предложили заменить врачом. Частное заменили общим.

Не стоит обобщать лично суженное восприятие слова на всех людей. Смотрите тогда уже вики.
Устройство - это достаточно общее понятие.
Нечто, имеющее строение, подчеркнуто сложное. Т.е. именно система.

С терапевтом все тоже не просто:
Терапия с греч. - лечение.
Вообще в медицине как раз это самый общий врач, что из названия обычному смертному вообще не ясно.
Дословно - лекарь, а если брать саму суть дела - скорее даже целитель, т.к. охватывает все лечение в целом,
Но в голове остались Средние века (хотя в то время все врачи были как раз на уровне "целителей").
Все равно люд говорит "зубник", "глазник", "ухогорлонос". Срамно, потому что не латынь?
Давно наблюдаю это издевательство в самом чисто виде - приходит народ с болячками и еще приходиться разбираться к какому врачу записываться.

Получатся что масло масленное.
Устройство состоящие из устройств есть устройство.

Как писал уже ранее - именно масло масляное и есть. Попытка "замазать" его новыми словами?
В языке уже есть более простой и правильный способ передачи этого отношения - приставка "под",
Правильно: устройство/система состоит из подустройств/подсистем.
Когда же для разграничения используются слова из разных языков, то не возможно сразу по ним понять, что из чего состоит.
Запросто можно найти как систему устройств, так и устройство с системами. Каждый раз придется лезть в узкопредметный словарь и проверять,
как же там в этом отдельно взятом случае недопереводчиками было принято считать правильно.

0

102

Пример из жизни - телевизор. Современный телевизор очень сложное устройство способное принимать и цифровые и аналоговые сигналы, воспроизводить музыку работать с wifi и т.д. Как это все работает я имею самое отдаленное представление (особенно чего там у плазменных показывает и каким образом). Устройство телевизора мне неизвестно (особенно конкретной модели). Телевизор система? Даже не сомневайтесь в этом. Она известна - да это телевизор, он на вид как телевизор, ведет себя как телевизор, имеет функции телевизора и т.д. Известно как он устроен? Нет, неизвестно.
Поиграйте словами в данной ситуации

Да запросто:

Пример из жизни - телевизор. Современный телевизор очень сложное устройство способное принимать и цифровые и аналоговые сигналы, воспроизводить музыку работать с wifi и т.д. Как это все работает я имею самое отдаленное представление (особенно чего там у плазменных показывает и каким образом). Устройство телевизора мне неизвестно (особенно конкретной модели).
Телевизор устройство? Даже не сомневайтесь в этом. Известно - да это телевизор, он на вид как телевизор, ведет себя как телевизор, имеет функции телевизора и т.д. Известно как (именно?) он устроен? Нет, неизвестно.

Избыточность мысли налицо. Вы по-прежнему заблуждаетесь, если думаете, что добавилось что-то полезное.

А это не масло масленное? Еще надо добавить что системы образуют надсистему для полноты картины и полного торжества игры словами.

В третий раз повторить могу - это именно масло масляное (кэп?), полученное из неперемасленных по мнению авторов предложений.

0

103

Система происходит от др.-греч. σύστημα «составленное; составление», далее из σύν (вариант: σύμ; первоначально ξύν) «с, вместе, совместно» + ἵστημι «ставить», далее из праиндоевр. *sta- «стоять». В ряде европейских языков слово заимств. через лат. systema.Русск. система — начиная с Петра I, заимств. через франц. système из лат.
То есть для других народов это звучит примерно как просто "состав", т.е. нечто составленное.

0

104

utkin написал(а):

Вот Вы говорите все новые слова смешны и удивительны, но почему они внедряются в язык?


Потому что к ним привыкают.

utkin написал(а):

Если Вы придете в какую-нибудь госконтору и скажите Азм есьм Акакий Порфирыч я думаю Вам могут и скорую вызвать. И потом санитарам объясняйте, что Вы боритесь за чистоту и культуру великого и могучего.


Зачём вы передёргиваете? Если нечего умного сказать, то лучше молчите.

utkin написал(а):

Я не знаю чего я носитель.


Значит, вы — глупец.

utkin написал(а):

Дальше то что? Какие действия, конкретика?


Мы действуем. Вы только языком болтаете.

utkin написал(а):

Вообще-то треть населения Земли говорит на китайском. Это Вам для справки, чтобы Вы так сказать правильно смотрели на мир.


Как это оспаривает то, что большинство стран — колонии Запада? К тому же, речь шла об англицизмах.

utkin написал(а):

Посчитайте соотношение "отчизнолюбцев" к общей массе населения страны и выразите в процентах.


Судя по опросам общественного мнения, отчизнолюбцев (патриотов, то есть тех, кто любит своё отечество) — большинство.

utkin написал(а):

У Вас ярко выраженное устойчивое эмоциональное состояние - все плохо, русский замещается иностранщиной, кругом глупцы, предатели и засланные агенты. Хорошо пусть будет так если Вам нравится. Но что Вы предпринимаете для исправления ситуации? Н-и-ч-е-г-о.


Ты за меня-то не решай, делаю я что-либо или же нет. Что ты обо мне вообще знаешь-то?

0

105

utkin написал(а):

Посмотрел словарь который в Экзеле. Просто жесть. Например системе дают определение термина структура. Ну нафиг такие замены, честно.


У слова «система» множество значений. Дают замены тем значениям, для которых замены есть. У многих иноязычных слов есть общие значения, поэтому в этих одинаковых значениях встречаются одинаковые замены.
А «структура» — это по-русски строение. Раньше говорили: «состав и строение», нынче: «состав и структура».

0

106

utkin написал(а):

Часть воды обладает свойствами большего объема воды, до тех пор пока Вы не начнете определять конкретный стакан и конкретную бутылку.


Если вспомнить о поверхностном натяжении жидкости, то у этого утверждения появятся границы применимости: капелька и вода объёмом с ведро поведут себя на той же жирной поверхности по-разному.

0

107

MihalNik1!

Спасибо большое вам!
Полностью согласен с вами в сказанном.
Сам я, кстати, заменяю слово «система» лишь в некоторых значениях: например, порядок счисления вместо «системы счисления».
Также в некоторых значениях подходят слова строй и устройство.
Но вообще я оставлял это слово на потом.
А теперь, когда прочитал ваше с Уткиным обсуждение, понял, что вы правы: слово устройство отлично подходит, наверное, в большинстве случаев.
То есть, на самом деле, система — это и есть устройство.

0

108

Не моё м.б. дело, но я бы снес на Вашем месте 114-ую запись.
(нет, я не считаю, что такое не нужно писать, писать м.б. даже и нужно - отправлять не стоит)

Сам я, кстати, заменяю слово «система» лишь в некоторых значениях: например, порядок счисления вместо «системы счисления».
Также в некоторых значениях подходят слова строй и устройство.
Но вообще я оставлял это слово на потом.
А теперь, когда прочитал ваше с Уткиным обсуждение, понял, что вы правы: слово устройство отлично подходит, наверное, в большинстве случаев.
То есть, на самом деле, система — это и есть устройство.

Оно на самом деле многозначное. Например, годно "связка уравнений" вместо системы.
Совершенно точно нет там никаких особых свойств кроме связывания переменными-неизвестными.
В употреблении с исчислением это слово, часто используется как излишняя обертка.
Дело в том, что и в других языках люди не чётко понимают значение этого слова.

0

109

utkin написал(а):

А почему к ним привыкают? Что этому способствует?


Человек ко всему привыкает. Этому способствует свойство человека привыкать, приспосабливаться ко всему.
Современным иностранным словам помогает внушение, вдалбливание этих слов в умы русских людей СМИ и кривативным классом.

utkin написал(а):

Ну вот и оскорбления поперли . Именно так Вы хотите возрождать русский язык? Весьма оригинально, я бы сказал.


Если человек говорит, что он не знает, носителем какого языка он является, то как он может не быть глупым?
Это не оскорбление в данном случае.

utkin написал(а):

Так я не понял, что достаточно объявить себя патриотом и тогда можно будет пользоваться иностранными словами? Вот наш президент заявлял, что он патриот, но иностранные слова вворачивает на раз-два. Ну-ка, объясните мне эти взаимоисключающие параграфы в стане отчизнолюбцев.


Вы сказали, что отчизнолюбцев меньшинство. Это неправда. Меньшинство как раз — такие как вы.

utkin написал(а):

Я и так вижу и без Вашего соизволения могу сделать выводы по агрессивной политике на форуме.


Да не было здесь ещё ничего злобного. Это ещё чрезвычайно мягко.
Возможно, мне проще было бы вас удалить с этой площадки, чтобы не тратить на вас своё время.
Всё равно вы не хотите работать на развитие русских вычислителей.

utkin написал(а):

Когда доходит дело до реальных шагов, сразу непонимание возникает.


Где вы увидели у себя «реальные шаги»? Вот что вы сделали для создания русской словесности в вычислительной области?
Ничего не сделали.

utkin написал(а):

Патриотов дофига, отчизнолюбцев единицы.


Это тождественные слова.

utkin написал(а):

Да и сами патриоты (ну кроме Вас) говорят, что они именно патриоты, а не отчизнолюбцы. То есть для любви к Родине и русскому языку используют иностранные слова. Это весьма забавно на мой взгляд.


Правильно, потому что такие вот языковые обезьяны засрали их язык и мозги.
Как говориться, скажи человеку сто раз, что он свинья, так он и захрюкает.
Большинство людей говорят так, как говорят все, даже не задумываясь о том, наше ли это слово или же нам его навязали языковые обезьяны-инопоклонщицы.

0

110

Решил не создавать отдельную тему, а спросить прямо тут.
Чем заменить слово reset?  ReSet состоит из двух Repeat Set что переводиться дословно как повторная установка.
Установка не очень хороший термин. Как мне кажется семантически более правильно использовать слово присвоить. Но также думаю над словом задать или вложить.

Смысл reset в том, что в ячейки присваиваются значение по умолчанию 0 или 1. Некоторые ячейки остаются в непредсказуемом состоянии 0 или 1.

Слово сброс которое устоялось в русском языке относится к флагам. Флаг можно установить и сбросить. Но даже так всё переврали в компьютерной технике. Его было уместно использовать как перевод для слова Clear.

Какие у кого будут предложения?

Отредактировано Павиа (19.12.2015 13:26:45)

0

111

Тут можно вспомнить знаменитую кнопку:
http://cs621819.vk.me/v621819908/2fba6/6_5HTfs7x-Y.jpg
Главное, чтобы это было "перезагрузка", а не "перегрузка".

0

112

Хорошая идея. Загрузить от слов: заполнить грузом.

Символ

Происхождение

Заграничное имя

Толкование

заг

загрузить

set

Положить данные в ячейку, в переменную или в объект

выг

выгрузить

get

вынуть данные из ячейку, из переменной или из объекта

ПРЗ

перезагрузить

ReSet

повторить загрузку начальными данными

перегрузка

режим переполнения чего либо, к примеру переполнение конденсатора зарядом

Электронщики не любят символы длиннее 3-х букв. Так как на схеме они плохо помещаются. Обычно 1 или 2 буквы.  Редко встречаются символы из 3 букв и очень редко 4 букв. Поэтому reset сокращают  до RST. А вот программисты хотя и любят писать длинные фразы, но всё же часто встречающиеся слова и мало информативные принято писать кратко. Поэтому для  get, set  предлагается писать не слова, а пользоваться сокращениями выг, заг.

Отредактировано Павиа (19.12.2015 18:04:16)

0

113

Павиа, а откуда вы взяли «repeat»?
Re- — это вроде приставка, соответствующая нашей пере-.

0

114

Сергей написал(а):

Павиа, а откуда вы взяли «repeat»?Re- — это вроде приставка, соответствующая нашей пере-.

Как говорил Шерлок Хомс - это очевидно! И доказывается путём индукции. Однако, одно другому не мешает.

Отредактировано Павиа (20.12.2015 21:36:49)

0

115

Чем заменить слово reset?

Если уже совсем кратко, "для электронщиков", то "с0" или м.б. лучше "в0":
"<нечто> в0"
"заг, выг, ПРЗ" - вообще не понять что такое, ни каких мыслей не вызывает.
"Выгрузить" м.б. и по смыслу не верно, разве что с явным освобождением памяти. С файлами, например, можно (для записи м.б. правильнее выгрузить чем close).

set/get повсеместно - тоже не очень хороший подход, перегружают исходники (Жаба ими грешит),
зачем "get x" или "getX" или "x.get", когда можно просто "x", на худой конец х()?
а set уже предполагает определенную точку изменения, поэтому
зачем "set x 15" или "x.set(15)",
когда можно:
x 15
а если смущает, то:
x(15)
или
x: 15
Последнее никому в объяснениях не нуждается и всего 1 дополнительный знак.
Но если Вам их надо прямо перевести, и желательно кратко, то это "сунь/вынь".

0

116

MihalNik1 написал(а):

Если уже совсем кратко, "для электронщиков", то "с0" или м.б. лучше "в0":

Лучше НУ. Начальные установки.  Но лично мне как программисту не приемлемо так сокращать слова.

кратко, то это "сунь/вынь".

Боюсь что другие это сочтут матом. Ещё не все забыли песенку про Барсука который не спит.
Понятно что ЗАГ и ВЫГ ничего не говорит. Но пока что это лучше хотя за сунь/вынь будущее.
Программы на языках Java и Си++ перегружены словами get и set. И лучше их сократить. Но даже в Delphi, где они сокращен, они в избытке. Откройте любой класса и в описание его стыковки с другими вы найдёте с десяток этих слов.

Сергей написал(а):

Павиа, а откуда вы взяли «repeat»?Re- — это вроде приставка, соответствующая нашей пере-.

Я таки погорячился с repeat. Reset имеет несколько смыслов. 
Материнской платы:
Hard reset - жёсткий сброс,
Soft reset - мягкий сброс;
У жёсткого диска:
srst - рестарт прошивки;
У регистра:
RST - установка начального значения;
У автомата:
RESET - рестарт в начало.

Отредактировано Павиа (21.12.2015 21:30:11)

0

117

Павиа написал(а):

Как говорил Шерлок Хомс - это очевидно! И доказывается путём индукции. Однако, одно другому не мешает.


Очевидно, что re- — это приставка.

Вот из этимологического словаря английского языка (http://www.etymonline.com/index.php?ter … in_frame=0):

reset (v.)
also re-set, 1650s, "place (a gem) in a new setting," from re- + set (v.). Related: Resetting. Meaning "cause a device to return to a former condition" is from 1847; intransitive sense from 1897. As a noun, from 1847.

Никакого repeat там нет и не было никогда.

0

118

Многие люди, и я в их числе, считают, что лучше не переводить английские обозначения, подстраиваясь под этот язык и его носителей, а придумывать свои обозначения, которые будут удобны нам — русским людям.

0

119

Символы в нашей жизни решают многое. Кто-то пройдёт и не заметит. Кто-то напротив обращает на них внимание и руководствуется ими как истинами. Лично я не обращаю на них внимание, но подсознательно реагирую на них. Причем сильно раздражает, так как рефлексы у меня сильные. Современные учёные именуют это информационным полем. Способностью информации притягивать или отталкивать.
В издательском деле хорошо известно, что каждая формул в половину уменьшает число читателей. Новые вещи и знаки пугают людей. В своё время торговцев считали колдунами за-то что они умели умножать и делить числа. Но стоит замаскировать новое старым и народ уже вовсю хватает новинки. 

В англоязычном мире уже сложились свои символы. А для русского языка их приходится изобретать. Основой программирования является математика. Предлагается по исследование операции и действия над числами. 
Есть следующие слова и знаки. От знаков надо отказаться, так как они пугают людей. Лучше всего их заменить узнаваемыми слова или аббревиатуры.  Но что-то у меня идей не хватает.   

sqrt  -   корень
div   ?-  делить
mod   ?-  %
Abs   ?-  ||
sqr   ?-  Ква или ^ или #
Ord   -   №
Succ  -   ++
Pred  -   --

Помогите с идеями? А то, у меня они закончились.

Отредактировано Павиа (04.01.2016 14:36:20)

0

120

От знаков надо отказаться, так как они пугают людей

Знаки сложения, вычитания, умножения и деления пугают только дошкольников. Зачем "делить", если есть "/"? Есть знакомые со школы операции сравнения: "<", "<=", ">", ">=". Людей, знакомых с логическими операциями, не испугают "&" и "|". Но стоит ли заниматься программированием, если не знаешь, что такое логические операции? Тех, кто знает Си, не испугают ">>", "<<", "^" и "%". Есть знаки, которые знакомы многим по Си и тоже не запутывают, типа "+=". Знакомые с языком D не побоятся операций логического вращения ">>>" и "<<<" - они такие же, как и Сишные операции ">>", "<<", только младшие биты переписываются в старшие и наоборот. Можно ещё некоторое количество знаков добавить, например "**" - это возведение в степень, так писали в языке PL/I.

Мне кажется, в приведённых мной операциях нет ничего заумного, чтобы могло кого-то оттолкнуть своей сложностью. Набор приведённых мной операций достаточно сжат. Расширять его особо не стоит - ну разве если что-то упущено. Или операции очевидны, как тернарные операции Питона "x<y<z" . Остальное можно писать словами: "корень", "порядок" и т.д. Конечно, и вышеперечисленным операциям тоже дать равнозначные слова: "сложить", "вычесть" и т.д. Но это уже дело вкуса.

0

121

Юрий написал(а):

"**" - это возведение в степень, так писали в языке PL/I


В Питоне так же сделано. Может быть, ещё где-нибудь.

Думаю, что и для извлечения корня нужной степени можно сделать так: Ч // с, где Ч — число, а с — степень корня.

Юрий написал(а):

тернарные операции Питона "x<y<z"


Цепочечные сравнения, а не «тернарные операции».

В Питоне можно делать и так:

a = 1
b = 2
c = 3

if 0 < a < b < c < 4:
    print("ДА")

Эти указания выведут: «ДА».

0

122

Ну да, вспоминается мне, что Питоновские "x<y<z" мы с Вами уже обсуждали.

0

123

Как перевести слово Control? есть два кандидата управление и служба, но оба не нравятся.
Суть в том что в это "регистре" объеденное две функции это воздействие и восприятие(измерение). т.е. прямая и обратная связь.
Собственно такое объединение характерно для многих Control'ов.

Отредактировано Павиа (15.01.2016 16:42:06)

0

124

Это не новое недоразумение. В русском языке пришедшие извне термины имеют узкую направленность, смысловую нагрузки. Там же, откуда пришли, эти же слова имеют куда более широкий смысл. У нас Control - это исключительно контроль, т.е. проверка, наблюдение за чем-то. У них Control - это ещё и управление. Поэтому знатоки английского заострили на этом слове внимание во время переговоров по СНВ между СССР и США, что в договоре должен  на ваш "Control", а наш "контроль" (вооружений).

0

125

Оставлю ка я слово управление. Прикольно получается:
PowerControl - станция управления питанием, СУП  ;-)

0

126

Я прошу прощения. Кто-нибудь реализовал программу для создания такого словаря? По ссылке в начале темы я не нахожу ничего. Мне такой словарь реально нужен.
Я думаю, что нет смысла спорить, а просто каждый участник должен предложить свой вариант. А каждый "клиент" мог бы профильтровать по автору. Потому что в рамках одного автора
набор понятий будет согласован между собой, а между разными авторами - необязательно.

0

127

Я давно всем предлагаю, но пока никто не согласился. Рассказываю.
На моём сайте был словарь терминов иностранного происхождения, которым подыскивали замену. Сам словарь - DokuWiki. Т.е. любй желающий может в этом поучаствовать. В определённый момент словарь раздулся и перестал помещаться на сайте. Я его скопировал, заархивировал, убрал с сайта. Есть у кого-то возможность положить его куда-то на сервер?. Всё, что он требует - это PHP + 170 Мб. Эти 170 Мб - после разархивации, потом потребеутся больше, потому что DokuWiki съедает много места для записей журналов изменений. Возможно, старые записи можно почистить, просто надо знать как и где. Вы готовы "приютить" такой словарь? Там довольно-таки много слов.

0

128

А нельзя просто расширить объём места на хостинге? Сколько это стоит?

0

129

Мне его выделяли на халяву. А халявное пространство из-за словаря быстро заканчивалось. Объём моего сайта был в разы меньше, чем словарь. У Вас есть, где его разместить? Я бы со спокойной совестью его передал бы кому-нибудь.

0

130

Если вы мне его отдадите, то я должен буду сам им заниматься. Я никогда сайтами не занимался и не стремлюсь к этому. Либо я должен буду попросить другого человека, который всё делает довольно медленно.
Я бы предпочёл просто оплатить расширение пространства там, где он уже лежит, поскольку это потребует наименьших действий.

0

131

Если вы мне его отдадите, то я должен буду сам им заниматься.

Видимо, проблема именно в этом: словарём никто не хочет заниматься. Никто. Котёночка все хотят погладить, а вот полностью взять на себя заботу о нём - немногие.

Я бы предпочёл просто оплатить расширение пространства там, где он уже лежит

Оно давно не лежит. Уже был переезд с места на место. Остался только архив.

0

132

Что нужно на стороне провайдера?

0

133

Хотя упрёк, что я не хочу взять котёночка, я не принимаю. У меня уже своих котов полон дом, кому-то рано или поздно должно не хватить места.

0

134

Залейте его на Яндекс/гугл- диск, м.б. кому-то и пригодится.

0

135

MihalNik1 написал(а):

Залейте его


- Волшебное слово?
- Бегом!

0

136

Ссылка
Когда разместите где-то в сети, дайте ссылку, чтобы я зашёл под администратором. После этого передам административные права.

0

137

Я почитал, как надо устанавливать эту систему. Это нужно отдельный сайт заводить, чтобы через возможные дыры в её безопасности нам весь сайт не сломали (а там много других вещей, кроме этого словаря). Далее, такую систему всегда нужно администрировать. Я не готов этим заниматься. Так что извините... Если хотите, чтобы я оплатил место на размещение - это вполне возможно. Может быть, когда хозяин сайта вернётся с халтуры, он сам этим займётся, но вероятность этого невелика.

0

138

Это архив целиком установленной системы. Настройки уже сделаны. Для её работы достаточно скопировать все файлы. Нужно лишь, чтобы PHP работал. Его можно проверить простейшим "hello, world". Есть некоторые халявные хостинги, где PHP есть, но нет разрешения записывать файлы. Вот такое не пойдёт. Но это хостинг типа wallst.ru. Обычно такой засады не бывает.

Ладно, если совсем всё так плохо, придётся опять самому найти халяву, скопировать, а потом сказать: "Ну всё, ребятки. Котёнка опять можно гладить". Тогда ждите дня 3-4. Надо время на это найти.

0

139

Юрий написал(а):

Я давно всем предлагаю, но пока никто не согласился.


Если кому-то передадите его, то сделайте так, чтобы там не было личных данных прежних участников. А то там ведь хранятся и ящики, и пароли к учёткам пользователей.

0

140

Юрий написал(а):

Видимо, проблема именно в этом: словарём никто не хочет заниматься. Никто.


Это неправда. Словарём занимался я, в основном, и мои сомышленники. И продолжаем. Просто у меня нет места, где его можно разместить, вот и всё.

0

141

А почему не разместить его на  wikia.com  ?

0

142

Если кому-то передадите его, то сделайте так, чтобы там не было личных данных прежних участников. А то там ведь хранятся и ящики, и пароли к учёткам пользователей.

Я оповещу. Поскольку всё останется без изменений, то все заинтересованные могут зайти и подправить свои данные.

Это неправда. Словарём занимался я, в основном, и мои сомышленники.

Т.е. были обычными пользователями словаря. Так сказать, котят гладили.

Просто у меня нет места, где его можно разместить, вот и всё.

Так его нет ни у кого. Чтобы оно появилось, надо что-то делать. А делать никто не собирается. Т.е. ровно то, что я и писал:

словарём никто не хочет заниматься. Никто.

А почему не разместить его на  wikia.com

Ну если она сделана на движке DokuWiki, да ещё дают административные права для доступа к файлам/папкам, чтобы переписать старое, то конечно можно было бы. Но кто ж такое даст?

0

143

Михаил Николаевич дал согласие разместить вики на нашем сайте, несмотря на риски безопасности. Нет, недостаточно скопировать файлы. Нужно ещё правильно проставить разрешения на файлы, иначе будет дыра в безопасности, см. https://www.dokuwiki.org/security . Если я когда-нибудь этим и займусь, то не раньше, чем разберусь как надо это настроить и как эту настройку осуществить у конкретного провайдера.

Далее, я хотел бы повторить свою позицию. Словарь не должен быть "Вики". Вики подразумевает наличие единой версии. Я считаю, что разные мнения в переводе терминов неизбежны и каждый вариант перевода должен быть ассоциирован с автором перевода. Кроме того, обязательно нужно взять переводы, уже существующие в культуре. Есть словари терминов, есть 1С, есть советская школа. Всё это должно быть использовано с указанием источника и возможностью фильтрации по слову и по источнику. Так что формат вики мне вообще не интересен, интересно лишь содержимое.

0

144

Юрий написал(а):

то все заинтересованные могут зайти и подправить свои данные


Дело-то не в этом. Просто зачем, во-первых, такие данные в сеть открыто размещать, а во-вторых, зачем кому-то постороннему такие данные передавать?

0

145

budden написал(а):

Далее, я хотел бы повторить свою позицию. Словарь не должен быть "Вики". Вики подразумевает наличие единой версии. Я считаю, что разные мнения в переводе терминов неизбежны и каждый вариант перевода должен быть ассоциирован с автором перевода. Кроме того, обязательно нужно взять переводы, уже существующие в культуре. Есть словари терминов, есть 1С, есть советская школа. Всё это должно быть использовано с указанием источника и возможностью фильтрации по слову и по источнику. Так что формат вики мне вообще не интересен, интересно лишь содержимое.


В таком случае вам придётся им заниматься в одиночку или искать своих единомышленников. В нашем словаре строгое правило: слова должны состоять только из славянских словообразовательных единиц.

0

146

Более общий словарь в несколько отстающем от разработки виде находится здесь: родноречие.рф
А вот здесь среда разработки словаря: https://docs.google.com/spreadsheets/d/ … tw-XORtIdk

0

147

Михаил Николаевич дал согласие разместить вики на нашем сайте

Ещё б знать, кто он такой, Михаил Николаевич. Может, он ещё что-то хорошее позволит сделать?

несмотря на риски безопасности. Нет, недостаточно скопировать файлы. Нужно ещё правильно проставить разрешения на файлы, иначе будет дыра в безопасности, см. https://www.dokuwiki.org/security . Если я когда-нибудь этим и займусь, то не раньше, чем разберусь, как надо это настроить и как эту настройку осуществить у конкретного провайдера.

Там пишут, что надо правильно написать файл .htaccess. Вроде бы не шибко сложная задача.

Далее, я хотел бы повторить свою позицию. Словарь не должен быть "Вики". Вики подразумевает наличие единой версии. Я считаю, что разные мнения в переводе терминов неизбежны и каждый вариант перевода должен быть ассоциирован с автором перевода. Кроме того, обязательно нужно взять переводы, уже существующие в культуре.

Да нет. В вики даже есть история изменений. Т.е. уже подразумевает разные версии – во времени. Во-вторых, вики – на то и вики, что там пишешь то, что хочешь. Например, можно написать так:
Компьютер
1. самосчёт (предложено Петровым)
2. вычислитель (предложено Сидоровым)
3. ЭВМ (электронно-вычислительная машина). Термин, появившийся в 1950-х годах. Был наиболее распространённым термином вплоть до наступления эпохи персональных компьютеров.  Так же встречались другие обозначения, применяемые к ЭВМ: АВМ (аналоговые вычислительные машины), ЦВМ (цифровые вычислительные машины), БЦВМ (бортовые цифровые вычислительные машины), ВК (вычислительные комплексы), ЭСМ (электрические счётные машины) и т.д.
4. писюк (предложено Рабиновичем)
Т.е. в ваших руках пластилин, лепите из него, что хочется.

Есть словари терминов, есть 1С, есть советская школа. Всё это должно быть использовано с указанием источника

Технология вики подразумевает наличие гиперссылок.

и возможностью фильтрации по слову и по источнику.

Ну это многовато Вы хотите от вики.

Так что формат вики мне вообще не интересен, интересно лишь содержимое.

Главное не форма, а содержание.

0

148

Надо делать не словарь. А корпус русских вычислителей.
1) Скачиваем 100 книг и 10 000 статей - склад данных.
2) Извлекаем словоформы.
3) Убираем часто встречающиеся слова.
4) Группируем словоформы в слова.
Цель добиться 10 000 слов. Столько слов надо для
5) Синхронизируем с  ru.wiktionary.org
6) Синхронизируем со словарями иностранных слов и словарем Даля.
Разделяем на русские коренные и заимствованные.
7) Над каждым словом производим антологический анализ.
8) Семантический анализ. Для каждого слова надо написать различные варианты толкования. И привести возле каждого толкования пример из склада данных.
Для не существующих придумать новые примеры. Но лучше вставить в виде статей в склад.
7) Добавить синонимы.

Отредактировано Павиа (26.06.2016 14:30:03)

0

149

> Ещё б знать, кто он такой, Михаил Николаевич
Это создать сайта rosinmn.ru , где мои материалы тоже теперь живут.

Юрий написал(а):

Там пишут, что надо правильно написать файл .htaccess

Это при условии, что тамошний веб-сервер его воспринимает. Что не факт, как там же и написано. Как понять, воспринимает или нет? Только тестированием. Как тестировать? Я не знаю. Цена не тестирования? Взлом.

>  Т.е. уже подразумевает разные версии – во времени.
Это неудобно и нереально пользоваться. Кроме того, если мы хотим единый словарь, то придут фанатики чистоты, фанатики прагматизма и передерутся на страницах словаря.
Наличие версий позволит им сосуществовать, не дерясь, ко благу всех.

> Ну это многовато Вы хотите от вики.
А я и не сторонник хранить эти данные в вики.

>  Скачиваем 100 книг и 10 000 статей - склад данных.
Кто персонально этим займётся? Вы готовы?

>  Более общий словарь в несколько отстающем от разработки виде находится здесь: родноречие.рф
Спасибо. Я посмотрел. Думаю, что Google docs - это хорошая идея, но он вряд ли потянет весь словарь - его возможности довольно ограничены. Я бы посоветовал разбить на много документов Google с гиперссылками между ними, чтобы каждый документ был небольшой по размеру. Вот эта идея жизненная, в отличие от вики. Если данный словарь, о котором мы ведём тут речь, есть в таком формате (или может быть переделан в него), то докувики вовсе не нужен.

Удивительно, что я постоянно пользуюсь google docs для работы и мне это не пришло в голову :)

0

150

budden написал(а):

Спасибо. Я посмотрел. Думаю, что Google docs - это хорошая идея, но он вряд ли потянет весь словарь - его возможности довольно ограничены. Я бы посоветовал...


Нам удобнее править всё в одном месте. Правда, там отдельные листы есть для разных особых областей.

0

151

Сергей, при всём при этом, ваше движение идеологично. Я за прагматизм. То есть, я вам могу прямо сказать, что я не буду делать свой проект на базе вашего словаря. Я, например, включил в свой проект слово "лепо вывести" вместо "pretty-print", но это частность. Так скажем, я бы заглядывал в ваш словарь, если бы это было удобно.

Слово "препроцессор" я не буду ни на что менять, оно меня устраивает. Я предлагаю вам не атаковать меня (вы моего решения не поменяете), а подумать, есть ли у нас поле для совместной работы. Скажем, есть ли у вас интерес в создании словаря, в котором указаны разные переводы терминов, в т.ч. из 1С и из советских книг.

Вот что у меня есть на сегодня (работа не особо хорошо организована, надо сказать):

https://bitbucket.org/budden/clcon/src/ … ew-default

https://bitbucket.org/budden/yar/src/de … ew-default

На другом компьютере ещё что-то есть, но сейчас это не под рукой.

Ещё раз повторяю: я предлагаю создать площадку, на которой разные переводы иностранных (и варианты русификации заимствованных) слов могут сосуществовать, а не биться насмерть. Google docs может для этого подходить, поскольку информация в нём структурирована, не требуется администрирование и есть поиск. Хотя я бы не назвал это идеалом, но можно начать работать.

0

152

budden написал(а):

Только тестированием. Как тестировать? Я не знаю. Цена не тестирования? Взлом.


Не «тестированием», а проверкой: создаёте .htaccess с какими-то настройками, смотрите, действуют ли они, меняете, если нужно, снова смотрите.
А вообще, достаточно выяснить, какое ПО стоит на вашем узле, и узнать в справке по этому ПО, поддерживает ли оно «.htaccess».

0

153

Сергей, вот я думаю (хотя точно не уверен), что разнесение этих листов в отдельные документы повысило бы производительность. Хотя я могу и ошибаться.

0

154

> А вообще, достаточно выяснить, какое ПО стоит на вашем узле,
Вы ответьте на такой вопрос: насколько докувики опережает ваш документ гугл (или наоборот)? Или они вообще не связаны?

0

155

> Ещё б знать, кто он такой, Михаил Николаевич
Это создать сайта rosinmn.ru , где мои материалы тоже теперь живут.

Не он ли пишет на этом форуме, подписываясь MihalNik1?

Как понять, воспринимает или нет? Только тестированием. Как тестировать? Я не знаю. Цена не тестирования? Взлом.

Нас тут призывают иметь совесть и называть тестирование испытанием. Проверить достаточно легко. Допустим, должны быть закрыты все файлы с расширением txt. Находим на сервере какой-нибудь /folder/foo.txt. Вводим в адресной строке: qwerty.ru/folder/foo.txt. Если файл открылся, значит есть доступ извне. Нет – значит всё хорошо.

>  Т.е. уже подразумевает разные версии – во времени.
Это неудобно и нереально пользоваться.

Да Вы что? Вы, наверное, никогда не правили Википедию. Весьма удобно наблюдать, как изменялась статья с момента твоей правки.

придут фанатики чистоты, фанатики прагматизма и передерутся на страницах словаря.

На это должны быть управляющие.

Я бы посоветовал разбить на много документов Google с гиперссылками между ними, чтобы каждый документ был небольшой по размеру.

Этот недостаток легко устраним с помощью вики.

Так мне заниматься старым словарём в DokuWiki или вы его бракуете? Просто не хочется делать то, что потом никому не нужно.

0

156

Кстати, родноречие.рф очень понравился. А кто его делал, чья работа?

Отредактировано Юрий (26.06.2016 15:09:22)

0

157

budden написал(а):

Я предлагаю вам не атаковать меня (вы моего решения не поменяете), а подумать, есть ли у нас поле для совместной работы.


Очевидно, что нет. Ничего общего с недорусками (это не оскорбление, а качество личности) у нас нет и быть не может.

budden написал(а):

переводы иностранных (и варианты русификации заимствованных) слов


Из этого речения можно сделать вывод, что, во-первых, иностранные слова — это не заимствованные и наоборот, и во-вторых, что перевод не есть русификация.
Глупости какие-то.

0

158

budden написал(а):

Вы ответьте на такой вопрос: насколько докувики опережает ваш документ гугл (или наоборот)? Или они вообще не связаны?


Вики-словарь уже давным давно не дорабатывался, все или почти все слова из него перенесены в гугловский словарь.

0

159

Юрий написал(а):

Кстати, родноречие.рф очень понравился. А кто его делал, чья работа?


Леонид Маршев.

0

160

> Не он ли пишет на этом форуме, подписываясь MihalNik1?
Нет. И я тоже не Михаил Николаевич, на всякий случай.

>  Проверить достаточно легко.
Как неудавшийся администратор линукса, я вам скажу как проверить: скачать программу для взлома сайтов и сказать: ломай этот сайт. Правда, тут могут вмешаться средства защиты самого хостера, так что это ещё нужно согласовать с хостером. Всё остальное - это не тестирование.

> Весьма удобно наблюдать, как изменялась статья с момента твоей правки.
Мне не надо это. Мне надо знать, что вот этот вариант из 1С, этот из советского словаря, а вот этот предложил Сергей. И чтобы Сергей не мог снести вариант из советского словаря за недостаточную исконность. Но чтобы я мог спросить "а как Сергей хочет перевести слово "pretty"? Кстати, я не вижу, чтобы в Родноречии эта возможность была. Для локализации нужно брать английские слова, без этого работать по локализации невозможно (да и новую разработку вести тоже вряд ли будет легко).

0

161

Если на данном сайте есть модератор, я прошу убрать пост с оценкой меня как "недоруска". За подобные эпитеты на любом сколько-нибудь нормальном форуме банят.
От вас, Сергей, я жду извинений, и пока их не поступит, нам с вами разговаривать не о чем.

0

162

budden написал(а):

Всё остальное - это не тестирование.


Какое нахрен «тестирование»? Что вы вообще эти тупым обезьянизмом называете? Вы вот употребляете это слово, и со стороны видно, что вы вообще не знаете его значения, просто очередная тупая языковая обезьянка.

0

163

Если на данном сайте есть модератор,

Есть, это я. Но моих прав недостаточно, чтобы редактировать записи владельца форума.

Это не здорово, что переходим на личности. Это нас не красит.

жду извинений

Денис, мне жаль, что были произнесены такие слова. Позвольте взять на себя чужую вину и принести извинения от себя.

0

164

budden написал(а):

От вас, Сергей, я жду извинений, и пока их не поступит, нам с вами разговаривать не о чем.


А мне не за что извиняться. Я сказал, что это не оскорбление, а качество личностей таких людей, как вы, — людей, которые не хотят быть русскими. Для таких «русский» — это просто название.
И мне плевать, что и как там на каких-то «нормальных форумах».

0

165

На всех «нормальных форумах» вас с вашим полурусским языком программирования высмеют и вытрут об вас и о него ноги.
Вот идите на эти «нормальные форумы» и продвигайте свою поделку там.

0

166

Юрий написал(а):

Денис, мне жаль, что были произнесены такие слова. Позвольте взять на себя чужую вину и принести извинения от себя.


Вы знаете, Юрий, у меня частенько складывается впечатление, что вы умеете быть самым настоящим т.н. «троллем».

0

167

Это только впечатление. Мне действительно жаль, что люди ссорятся. Это искренне. Как сказал бы знакомый мне батюшка: «Враг рода человеческого очень радуется нашим ссорам. Вспомните: "Заповедь новую даю вам: да любите друг друга"».

0

168

Но вернёмся к теме. Раз уж зашла речь, у кого есть ещё какие ресурсы на тему локализации?

0

169

Вот вроде бы есть. Ищите и обрящите.

0

170

А... Теперь я наконец-то понял, что главный на этом форуме и есть Сергей. Ну - тогда до свидания. У Юрия есть моя электронная почта, так что если кто-то хочет со мной связаться - возможность есть. Всего доброго и счастливо оставаться!

0

171

budden
Молокосос! Ну что собрался уходить? Так беги сразу к мамке.
Обиделся он. Думаешь теперь кто-то тебя пожелтеет? А некому ты не нужен. Отсюда погнали от туда погнали куда денешься?
В угол, что ли забьешься?

Вздох-выдох.
Знаешь поговорку? "На обиженных воду возят."  Будешь, дальше обижаться - будем воду возить на вас, а вы даже не заметите. Кстати эти люди придумали что программисты это асоциальные люди и живут в одиночестве. Этим злым языкам  надо было разделить их. По одиночке проще справиться. А вот Ричардом Столлманом  призвал программистов объединиться и переписать закрытый UNIX на открытые коды. Он создал GNU. И он же породил Линукса.

У всех людей разные желания. И не всегда они совпадают с вашими. Это было и есть везде и во все времена. Так учитесь жить с этим. Учитесь совместно делать общие дела.  Учитесь дружить. А пока что у нас каждый кулик хвалит своё болото. Чем больше людей движется в одном направление тем дальше они смогут добраться. Один человек может пройти 1 км. Но группа людей создала корабль и поплыв открывать новый свет. Так была открыта Америка. А после люди сплотились единой мыслью полёта в космос и создали космические корабли. Но на это потребовалось усилия всей страны.

Отредактировано Павиа (26.06.2016 18:24:08)

0

172

К чему этот раздор? Прекратите! Зачем разжигать страсти? Нам слово дано для благих целей.

0

173

budden написал(а):

я хотел бы повторить свою позицию. Словарь не должен быть "Вики". Вики подразумевает наличие единой версии. Я считаю, что разные мнения в переводе терминов неизбежны и каждый вариант перевода должен быть ассоциирован с автором перевода. Кроме того, обязательно нужно взять переводы, уже существующие в культуре. Есть словари терминов, есть 1С, есть советская школа. Всё это должно быть использовано с указанием источника и возможностью фильтрации по слову и по источнику. Так что формат вики мне вообще не интересен, интересно лишь содержимое.
если мы хотим единый словарь, то придут фанатики чистоты, фанатики прагматизма и передерутся на страницах словаря.
Наличие версий позволит им сосуществовать, не дерясь, ко благу всех.
Мне надо знать, что вот этот вариант из 1С, этот из советского словаря, а вот этот предложил Сергей. И чтобы Сергей не мог снести вариант из советского словаря за недостаточную исконность. Но чтобы я мог спросить "а как Сергей хочет перевести слово "pretty"?
Для локализации нужно брать английские слова, без этого работать по локализации невозможно (да и новую разработку вести тоже вряд ли будет легко).

полностью поддерживаю эту позицию. морально, материального самому не хватает.

budden написал(а):

Я бы посоветовал разбить на много документов Google с гиперссылками между ними, чтобы каждый документ был небольшой по размеру. Вот эта идея жизненная, в отличие от вики.

на сервисе github.com есть фича gh-pages.
Там можно размещать документы html или markdown (с гиперссылками)
там можно разместить много пользователей, форкать и коммитить

budden написал(а):

https://bitbucket.org

не знаю, если ли на bitbucket аналог ghpages...

Сергей написал(а):

Ничего общего с недорусками (это не оскорбление, а качество личности) у нас нет и быть не может.

Фашизм. Приписывание признака с последующим геноцидом. От его виртуальности суть не меняется.

Сергей написал(а):

мне плевать, что и как там на каких-то «нормальных форумах»

а мне не плевать, мой дед фашистов убивал

Отредактировано ВежливыйЛис (28.06.2016 07:57:53)

0

174

форкать и коммитить

ответвлять и затверждать

Отредактировано Павиа (28.06.2016 21:55:27)

0

175

Павиа написал(а):

ответвлять и затверждать


отсаживать, прививать

0

176

ВежливыйЛис написал(а):

а мне не плевать, мой дед фашистов убивал


ВежливыйЛис написал(а):

форкать и коммитить


Так мой дед тоже воевал. Три войны прошёл, в ВОВ на Т-34-х, на Курской дуге был. Но не для того, чтобы такие англосаксонские подстилки, как вы, превращали в дерьмо его родной Русский язык.

0

177

Павиа, обратите внимание на эти его слова:

ВежливыйЛис написал(а):

отсаживать, прививать


Я тонких троллей обычно хорошо распознаю. Хотя здесь толстовато, я считаю.

0

178

Решил я всё таки попробовать разобрать 100 книг. Я разочарован, слишком много труда, а результат неудовлетворителен. 
Библиотека 250 книг:
100 - книг английские сразу отобрал удалил.
75 - книг не распознано
75 - книг распознано.
Из этих 75 книг пришлось на перераспознование отправить 27. А по хорошему надо все.
Жарко процесс распознавания идёт медленно.

Пришлось по написать много кода.
---------------------------
И собственно, что плохо?
- Много и долго распознавать;
- много ручной работы;
- Много мусора, и чем больше книг тем мусор растёт быстрее чем слова;
- много словоформ. 

На текущий момент: словоформ 300 тысяч. Процесс пока идёт, работаю над качеством списка.
Но число оказалось выше ожидаемого раз в 5 и качество ниже ожидаемого.

0

179

А чего там много ручного кода, регулярные выражения не распознают словоформы?
Что подразумевается под "распознано" или нет? Как отличаете мусор?
Что Вы хотите от набора словоформ? Теоретически кол-во слишком велико, есть правила изменения частей речи (редкие слова будут не для всех случаев и т.п.).

0

180

MihalNik1
Под распознаванием подразумевается процесс перевода из картинок, djvu, pdf в txt файлы.
Регулярные выражения тут не помогают. Да и с автоматизацией беда. Та программа, которую я использую, может за один рас обрабатывать только 1 книгу. Нельзя направить очередь файлов.
Процесс этот медленный. Использую не самую быструю программу, но самую качественную.
30-60 минут уходит на одну книгу. 150 книг, 150 часов. 

У pdf и djvu файлов также встречается текстовый слой. Т.е. они уже были распознаны. Проблема в том что качество, такого распознавание очень плохое. А выяснилось это только после того как все словоформы были объединены в один файл.

Все 250 книг пришлось отсортировать вручную. Так как регуляторами сложно определить язык, особенно если в книге изначально нет текстового слоя.
Да даже если делать это по текстовому слою, то у 5 книг вначале стоят страницы с английским текстом, а только потом начинаются с русским.
Так же было штук 5 книг в которых распознано только первые 10 страниц.
Штук 5 книг с каракулями вместо русских слов(pdf с защитой от копирования).
Штук 10 книг просто с ужасным качественное распознавания.
Штук 10 книг с плохим, недостаточным качеством.

При этом качество регулярные выражения не могут определить качество, пришлось просматривать все книги вручную.

И для автоматизации все тексты должны быть в одной кодировке. Пришлось в ручную переводить, так как нет гарантии, что кодировка верно определиться.
Таких штуке 2 было.
А ещё по дороге 2 файла не верно преобразовались.

Как отличаете мусор?

Пока что на глаз. Если у вас есть идеи то я бы их выслушал.

Что Вы хотите от набора словоформ?

Словарик русских вычислителей. Предполагалось что разобрав 100 книг я получу 10 000 слов. Тогда можно было бы их понемногу переводить или подискивать им замену.

Теоретически кол-во слишком велико, есть правила изменения частей речи (редкие слова будут не для всех случаев и т.п.).

Пока что до этой стадии не дошел. Слишком много мусора. Но на первый взгляд все с точностью до наоборот. Термины из нашей области встречаются чаще чем общие слова.

А по поводу регулярных выражений. Я честно так их не придумал куда можно пристроить. У меня есть свой тексторез и мне было не сложно его переделать с искусственного языка на естественный. Тем более в дальнейшем есть мысли привязать к каждой словоформе её порядковый номер и смещение от начала файла.

Вот к примеру чем тут помогут регулярные выражения? Пример муссора.

Хул
Хулиган
Хун
Хуп
Хуршида
Хуэни
Хф
Хф1
Хф4-
Хф4-мо-
Хф4-модели
Хф4-теории
ХфО
ХфУ
ХфХк
Хфа-2
Хфк
Хфоо
Хх
Хх-
Хх-f-
Хх0
ХхУ
Ххк
Ххо
Ххп
Хц
Хц-
ХцР
ХцХл
Хцещё
Хцо
Хч
Хчетн
Хчллман
ХчнЫни
Хчч
Хш
Хш-
Хш-матрицу
Хшах
Хширина
Хщ
Хщах
Хъ
Хы
Хыолсмаи
Хыршова
Хь
Хь-а
Хьен
Хьр
Хью

Отредактировано Павиа (05.07.2016 11:05:25)

0

181

Под распознаванием подразумевается процесс перевода из картинок, djvu, pdf в txt файлы.

Чем обусловлен этот выбор, почему взяты не текстовые книги?

Но на первый взгляд все с точностью до наоборот. Термины из нашей области встречаются чаще чем общие слова.

Т.е., насколько понял, Вы отобрали технические книги? Соответственно, их не было в текстовом виде, так?
А точно нет данных в тексте? Не проще в сети крупные источники какие-нибудь прочесать?

Вот к примеру чем тут помогут регулярные выражения? Пример муссора.

Они работают над текстом, часто с удобным отношением грубость/затратность.
Можно дать частичное определение явного мусора, например, недопустимое смешение знаков, кол-во букв (>4) и т.д.

Пока что на глаз. Если у вас есть идеи то я бы их выслушал.

Ну, либо определяете удобный набор действий мышкой над текстом, либо многократное переписывание правил, либо более строгий отбор и большие объемы данных обрабатывать.

0

182

Чем обусловлен этот выбор, почему взяты не текстовые книги?

Взята классика информатики и программирования:
Стивен МакКонналл Совершенный код
(Профессионально) Брукс.-Мифический человеко-месяц или как создаются программные системы-Символ (2003)
А.Б.Сергиенко_Цифровая обработка сигналов
Эрвин_Кнут_(Donald_E._Knuth)-Искусство_программирования.
OpenGL Red Book
(Классика программирования) Вирт Н., Гуткнехт Ю.-Разработка операционной системы и компилятора. Проект Оберон
Питер АБЕЛЬ АССЕМБЛЕР И ПРОГРАММИРОВАНИЕ ДЛЯ IBM PC
Бьерн Страуструп. the_c++_programming_language_2ed_rus
и тд.

В текстовом виде их нет. Либо опять таки с неизвестным качеством. В текстовой вид книги переводились в 90-тых годах. С 2000 жесткие диски стали большими и народ стал хранить их в виде фотографий с сохранением оригинальной структуры.

А точно нет данных в тексте?

Я не праверял, взял только то что читал сам. И то что было под рукой.
Если вы читали эти книги, то могли бы заметить что то как пишут в них отличается от того, как принято писать в интернете. Поэтому любопытно же сравнить.

недопустимое смешение знаков, кол-во букв (>4) и т.д.

А недопустимые это какие? Больше 4 ограничьте не вижу смысла. Мы теряем много полезных слов: кэш, мэш, трэш, ЧПУ,  чип, крэш и тд.

0

183

Павиа написал(а):

много полезных слов:
кэш, мэш, трэш, ЧПУ,  чип, крэш и тд.


дэш, слэш, клэш, флэш,
но останутся бэкслэш и сплэш

0

184

Удалил все то, что встретилось менее 5 раз, и длинною менее 3-х символов, и всё что начинается с латинской буквы.
Большая часть мусора ушла. Осталось 42 тысячи словоформ.  Можно скачать от сюда
http://rusfolder.com/45142649

Отредактировано Павиа (08.07.2016 22:01:26)

0

185

Павиа написал(а):

от сюда


Слитно.

Я чего хотел сказать: недостаточно корпуса текстов (ну то есть подборки текстов) и словаря (то есть списка слов). Ещё нужна разметка и статистика. Слова употребляются в контексте, значит для описания этого контекста нужна модель данных.

В простейшем случае - пары слов, что с чем употребляется с какой частотой. В не очень простейшем - цепи (русские, кстати) Маркова.

Всё это надо как-то хранить, и лучше, мне кажется, в XML, чем в CSV.

0

186

Юрий написал(а):

Ведь можно было сделать "попродвинутее".

Думаю, можно и "попродвинутее". В инете появился русскоязычный вариант ресурса, позволяющего работать командой.
На каждое обсуждаемое слово можно заводить отдельную карточку... Например так.
Также у членов команды вся актуальная информация будет всегда под рукой

Отредактировано sandro (17.09.2016 16:33:51)

0

187

sandro
Вторая и третья ссылки не работают. Первая работает, но там пусто!
Во-вторых панацеи не существует. Если вам обещают всё и сразу - знайте вас обманывают.

0

188

Павиа написал(а):

Вторая и третья ссылки не работают. Первая работает, но там пусто!

- Виноват, исправил...
Просто я в спешке забыл эти странички из командных - публичными сделать. Сейчас их могут прочитать все. (другими браузерами проверил тоже)))
- Понимаю, что это далеко не GitHub, но кое-какие удобства имеются.
Туда, (в команду), нужно добавить участников, у которых есть необходимое инфо и ссылки на русскоязычные ресурсы, а также сделать их администраторами или редакторами.
Кому приглянется сия затея - дайте знать.
Приглашение в команду - здесь.

Отредактировано sandro (18.09.2016 05:51:58)

0

189

MihalNik1 написал(а):

кратко, то это "сунь/вынь".

- Прекрасный пример, "ибо кратко"...
Ещё короче - "вне/вну"(трь). Китайцам на эту тему проще, у них есть "инь/янь"
Временно представил себе "праобраз" Буля, родившегося бы у нас, где-нибудь в глубинке. (да хотя бы у меня в соседях)))
- Мигом бы "освистали", раскритиковали, подняли бы на смех из-за невозможности "скоренько" применить на практике его "безумные" идеи, а все "беспочвенные" философствования по этому поводу посчитали бы "бредом выжившего из ума чудилы"...
Оказывается, мобилизовать народ на придумывание новых словок достаточно легко. Живой пример - здесь. Там много бестолковщины, но проблёскивают и стоящие примеры. Я вот тоже не удержался и "насловоблудил" чуток:
Дискретное представление точки
- "Аз Есмь Альфа и Омега"... (начало и конец)

0

190

timeout - бой часов

0

191

Читал эту ветку и нашел для себя очень много интересных а иногда и весьма комичных замечаний.

Павиа и Сергей, а в жизни Вы, если не секрет конечно, "твари дрожащие" или "власть имеющие" ?

Отредактировано Яр (04.11.2016 13:37:05)

0

192

Иеархический - древовидный или единоначалие.

0

193

Обновил список добавил ещё исконных русских лов, но всё ещё 40% нуждаются в паре.
http://ru.complang.wikia.com/wiki/Мы_ищем_пару

0

194

Подготовил ещё 313 заграничных словоформ. Такой вопрос их лучше оформить отдельной страницей или встроить в существующую?

0

195

Считаю что нужно бороться не с непосредственно заимствованными словами, ибо данный процесс естественный и является одним из основных источников обогащения словарного запаса языка.
Но вот бороться за то что бы процесс заимствования происходил в строгом соответствии с правилами и традициями русского языка я уже считаю вполне разумным и оправданным требованием.
Так например слова "parsing", "parser" и т.п. образованы от корня "parse" и в том случае если мы все же вынужденны будем прибегнуть к заимствованию это должно быть только лишь заимствование основы, т.е. слова "parse" ведь если даже допустить что в русском языке нет подходящего ему аналога, то уж механизмы словообразования в русском языке имеются и свои.
А значит не "парсинг" а "парсировать" или "парсовать", и не "парсер" а "парсировщик"/"парсовщик".
Суффикс "-овать" является одним из активным средством приспособления к русской глагольной системе именных и глагольных основ, заимствованных из других языков.

P.S.
Слово "parse" и его производные использованы сугубо в качестве примера, и не означает того что в русском языке действительно не существует аналога данному термину.

0

196

рст256 написал(а):

и не "парсер" а "парсировщик"/"парсовщик".

Ага ещё скажите не слон, а слонщик. Есть бочкарь, пушкарь и шуршунчик.

рст256 написал(а):

"парсинг" а "парсировать"

Парсить не?

рст256 написал(а):

Но вот бороться за то что бы процесс заимствования происходил в строгом соответствии с правилами и традициями русского языка я уже считаю вполне разумным и оправданным требованием.

А ничего что эти правила меняются со временем? Да и вообще их как таковых нет.

0

197

Павиа написал(а):

Парсить не?

Да парсить звучит гораздо лучше.

Павиа написал(а):

А ничего что эти правила меняются со временем?

То что меняются это хорошо, не меняются со временем правила только у мертвых языков.

Павиа написал(а):

Да и вообще их как таковых нет.

Как нет?! А что же там тогда со временем меняется?

0

198

Семантический анализатор - смысло уловитель.

0

199

рст256 написал(а):

...и является одним из основных источников обогащения словарного запаса языка


Враньё. В русском языке заимствований не более 20%.
Основной источник пополнения словарного запаса языка — словотворчество народа-носителя языка.
Про в последние десятилетия его носители больше подражают, чем творят, отсюда и тяга к заимствованиям в эти десятилетия.
Ну, и мода на всё иностранное. Куда ж без неё?

0

200

Языковед написал(а):

Основной источник пополнения словарного запаса языка — словотворчество народа-носителя языка.

- Верно сказано...
Дополню: - когда я хочу выразить в словах что-либо из мыслей, да ещё выразить так, чтобы меня поняли если не все, то хотя бы большинство из окружающих, то мне совсем невдомёк, какое из слов, мной произнесённых, может вдруг оказаться "заимствованным" - для меня все слова в этот момент - мои. В общении я никогда не употребляю слов, якобы "повышающих имидж оратора", а потому считающихся либо "модными" либо "крутыми" на сегодня. Всегда более важен смысл, а не "впечатление от сказанного". В моём случае исключением может быть или своеобразный юмор или сарказм или иное "иносказательное" словотворчество, (кое иногда бывает тоже необходимо в общем потоке "словоблудия")))...

Отредактировано sandro (26.02.2017 20:31:45)

0


Вы здесь » Русские вычислители » Словесность » Словарь терминов в информатике


форум на 24bb Создать форум бесплатно