Надежность и живучесть бортовых вычислительных систем (БЦВС).
Надежность – это свойство изделий выполнять требуемые функции, сохраняя свои эксплуатационные показатели в заданных пределах в течение требуемого промежутка времени.
Живучесть - способность вычислительной системы выполнять свои основные функции, несмотря на полученные повреждения и вышедшие из строя элементы аппаратуры.
К надежности и живучести БУВМ и БЦВС предъявляются более жесткие требования, чем к надежности и живучести универсальных и персональных ЭВМ. При отказе БЦВМ нарушается работоспособность системы, и не выполняются поставленные задачи, что может привести к непоправимым последствиям, в том числе и к человеческим жертвам.
Повторное решение задачи после восстановления БЦВМ и БЦВС часто невозможно. Так, например, при сбое в работе БЦВС зенитно-ракетного комплекса будет уничтожен обороняемый объект. И, если вы в короткий срок восстановите работу системы, то разрушения не удастся вернуть так же, как и потерянные жизни. Сбой в авионике может привести к крушению самолета или самопроизвольному сходу ракет. В этом случае восстановление работы БЦВС так же не позволит исправить последствия ошибки.
Обеспечение высокой надежности и живучести БЦВС усложняется условиями работы аппаратуры на борту при больших колебаниях температуры, влажности, действии механических нагрузок и в условии высокой запыленности. Так же ограничение накладывается на габариты и массу аппаратуры. Это в основном относится к авиации, но так же большое значение имеет и для БЦВС других направлений.
Таким образом, проблема надежности и живучести БЦВМ и БЦВС имеет ряд особенностей, обусловленных своеобразием структуры БЦВМ и характером выполняемых ими функций.
Задача обеспечения в сложной системе высокой надежности и живучести может оказаться весьма дорогостоящей, сложной и требующей больших затрат времени, хотя затруднения с выпуском продукции и проблемы, возникающие во время эксплуатации, в связи с необходимостью обеспечения и поддержания требуемого уровня надежности, могут вызвать еще большие затруднения.
Например, при уменьшении надежности ракетной системы на 10% для обеспечения одной и той же степени поражения цели потребуется увеличение, по меньшей мере, на 10% фактического количества боевых ракет. Для этих ракет нужны дополнительные пусковые площадки, испытательная аппаратура, оборудование для пуска, обслуживающий персонал и вспомогательное оборудование, что связано с большими затратами денежных средств и времени.
Чем сложнее структура вычислительной системы, тем труднее обеспечить надежность и живучесть. Следует заметить, что большинство отказов, имевших место при пусках управляемых ракет и искусственных спутников в США, не было вызвано неисправностью какого-либо экзотического устройства, конструкция которого ускорила прогресс современного уровня техники. Напротив, многие отказы были вызваны неисправностью функциональных и конструктивных элементов ранее апробированной конструкции. Иногда элементы были изготовлены неправильно, а в других случаях имели место ошибки в работе программистов или обслуживающего персонала. Нет такой мелочи, которая была бы слишком ничтожной для того, чтобы не оказаться возможной причиной отказа. Высокие потенциальная и практически достижимая надежности в значительной степени являются результатом глубокого и пристального внимания к мелочам.
Проблема повышения надежности и отказоустойчивости свойственна не только БЦВС, но и коммерческой аппаратуре. Например, в кластере Google в среднем происходит отказ 1 компьютера в день (то есть за год аварии происходят примерно на 3% компьютеров). Конечно, за счет резервирования данных и кода эти сбои пользователям незаметны, но для программиста они являются большой проблемой.
Случай, когда вычислительная система или ее часть вышли из строя, и дальнейшая работа невозможна без ремонта - называется отказом.
Теория надежности различает 3 характерных признака отказов, которые могут быть присуще аппаратуре и проявляются без всякого воздействия со стороны людей.
1. Приработные отказы. Эти отказы происходят в течение раннего периода эксплуатации и в большинстве случаев вызваны недостатком технологии производства и дефектами при изготовлении элементов вычислительных систем. Эти отказы могут быть исключены процессом отбраковки, приработки и технологического тестирования готового изделия.
2. Дефектные или постепенные отказы. Это - отказы, возникающие из-за износа отдельных параметров или частей аппаратуры. Они характеризуются постепенным изменением параметров изделия или элементов. В начале эти отказы могут проявляется как временные сбои. Однако, по мере того, как износ возрастает, временные сбои превращаются в серьезные отказы аппаратуры. Эти отказы являются признаком старения БЦВС. Они частично могут быть устранены при правильной эксплуатации, хорошей профилактике и своевременной замене изношенных элементов аппаратуры.
3. Внезапные или катастрофические отказы. Эти отказы не могут быть устранены ни при отладке аппаратуры, ни правильным обслуживанием, ни профилактикой. Внезапные отказы возникают случайно, никто не может их предсказать, однако, они подчиняются определенным законам вероятности. Так что частота внезапных отказов в течение достаточно большого периода времени становится примерно постоянной. Это происходит в любой аппаратуре. Примером случайных отказов является обрыв или замыкание цепей. Такой отказ приводит, обычно, к тому, что на выходе устанавливается постоянно либо 0, либо 1. При возникновении случайных отказов необходимо заменять элементы, в которых они произошли. Для этого вычислительная система должна быть ремонтопригодной и позволять быстро проводить профилактические работы в полевых условиях.
В отдельную группу можно выделить перемежающиеся отказы или сбои. Под сбоем подразумевается кратковременное нарушение нормальной работы БЦВМ, при котором один или несколько ее элементов, при выполнении одной или нескольких смежных операции, дает случайный результат. После сбоя вычислительная система может нормально функционировать в течение длительного времени.
Причиной возникновения сбоев могут быть электромагнитные наводки, механические воздействия и др. Часто сбои не приводит к выходу из строя комплекса, а только изменяют ход работы программного обеспечения из-за неверного выполнения одной или нескольких команд, что может привести к катастрофическим последствиям. Отличие сбоев от отказов в том, что при обнаружении последствий от сбоя, необходимо восстанавливать не аппаратуру, а информацию, искаженную сбоем.
Рассказывая о сбоях, необходимо упомянуть о, так называемых, Шрёдинбагах. Шрёдинбаг – это ошибка, при которой вычислительная система долгое время функционирует нормально, однако, при определенных условиях, например, задании нестандартных параметров работы, возникает сбой. При анализе этого сбоя оказывается, что программное обеспечение вычислительной системы имеет принципиальную ошибку, из-за которой оно в принципе не должно было функционировать.
Шрёдинбаг может быть образован сложной комбинацией парных ошибок (когда ошибка в одном месте компенсируется ошибкой противоположного действия в другом месте). При определенном стечении обстоятельств баланс ошибок разрушается, что приводит к парализации работы.
Таким образом, для БЦВС характерно еще одно свойство, определяющее ее надежность – безошибочность или достоверность функционирования. Следовательно, надежность БЦВС – это совокупность безотказности, достоверности функционирования, живучести и ремонтопригодности.
В качестве параметров надежности применяют:
1. Интенсивность отказов –
2. Средняя наработка на отказ –
3. Вероятность безотказной работы в течение заданного времени – Р
4. Вероятность отказа – Q
Интенсивность отказов
Интенсивность отказов – это частота, с которой происходят отказы. Если аппаратура состоит из нескольких элементов, то ее интенсивность отказов равна сумме интенсивности отказов всех элементов, отказы которых приводят к неисправности оборудования.
Кривая интенсивности отказов, в зависимости от времени эксплуатации, изображена на рисунке ниже.
При начале эксплуатации (в момент времени t = 0) вводится в действие большое количество элементов. Эта совокупность элементов в начале может имеет большую интенсивность отказов, за счет дефектных образцов. Поскольку дефектные элементы отказывают один за другим, интенсивность отказов относительно быстро уменьшается в течение периода приработки и становится приблизительно постоянной к моменту нормальной эксплуатации (Т норм), когда дефектные элементы уже отказали, и были заменены на работоспособные.
Совокупность элементов, прошедших период приработки, имеет самый низкий уровень отказов, который сохраняется примерно постоянным до начала выхода из строя элементов, из-за износа (Т износа). С этого момента интенсивность отказов начинает возрастать.
Средняя наработка на отказ
Средняя наработка на отказ – это отношение общего отработанного времени к общему числу отказов. В течение периода нормальной эксплуатации, когда интенсивность отказов примерно постоянна, средняя наработка на отказ представляет собой величину обратную интенсивности отказов:
Вероятность безотказной работы.
Вероятностью безотказной работы называется вероятное или ожидаемое число устройств, которое будет безотказно функционировать в течение заданного периода времени:
Эта формула справедлива для всех устройств, которые прошли приработку, но не испытывают влияние износа. Следовательно, время t не может превышать периода нормальной эксплуатации устройств.
График, показывающий вероятность безотказной работы в зависимости от времени нормальной эксплуатации, приведен ниже:
Вероятность отказа.
Вероятность отказа – это величина обратная вероятности безотказной работы.
Номинальная интенсивность отказов.
Элементы аппаратуры проектируют так, чтобы они могла выдерживать определенные номинальные: напряжение, силу тока, температуру, вибрации, влажность и так далее. Когда аппаратура в процессе работы подвергается влиянию таких воздействий, наблюдается некая определенная интенсивность отказов. Ее называют номинальной интенсивностью отказов.
При увеличении общей рабочей нагрузи или некоторых частных нагрузок, или вредных воздействий окружающей среды сверх номинальных уровней, интенсивность отказов возрастает довольно резко по сравнению со своим номинальным значением. И наоборот, интенсивность отказов уменьшается, когда нагрузка становится ниже номинального уровня.
Например, если элемент должен работать при номинальном значении температуры 60 градусов, то путем понижения температуры, в результате применения принудительной системы охлаждения, можно снизить интенсивность отказов. Однако, если снижение температуры влечет за собой слишком большое увеличение количества элементов и веса аппаратуры, то более выгодным может оказаться выбор элементов с увеличенным номинальным значением рабочей температуры и применение их при температуре, ниже номинальной. В этом случае аппаратура может стать дешевле, а масса меньше (что принципиально при работе в летательном аппарате), чем при применении принудительной системы охлаждения.
Методы определения надежности БЦВС.
Когда проектируются и создаются новые изделия механическими, электрическими, химическими или другими измерениями, нельзя определить значение интенсивности отказов. Интенсивность отказов можно определить путем сбора статистических данных, полученных при испытании на надежность этого или аналогичных изделий.
Вероятность безотказной работы в течение любого момента времени испытаний выражается формулой:
Интенсивность отказов определяется формулой:
При измерении интенсивности отказов необходимо поддерживать постоянное число элементов, участвующих в испытании, путем замены отказавших элементов новыми.
Таким образом, для получения данных о количественных характеристиках надежности аппаратуры, необходимо изготовить специальный образец аппаратуры для испытаний на надежность. Испытания на надежность должны проводиться в условиях, соответствующих реальным условиям эксплуатации оборудования по внешним воздействиям, периодичности включения и изменения параметров питания.
На стадии прикидочного и ориентировочного расчетов электротехнических устройств рассчитывают основные показатели надежности.
Основными качественными показателями надежности является:
Интенсивность отказов
Средняя наработка до отказа.
Интенсивность отказов l(t) - это число отказавшихn(t) элементов устройства в единицу времени, отнесенное к среднему общему числу элементов N(t) , работоспособных к моменту времени Δ t [ 9]
l (t)=n(t)/(Nt*Δt) ,
где Δt - заданный отрезок времени.
Например : 1000 элементов устройства работали 500 часов. За это время отказали 2 элемента. Отсюда,
l (t)=n(t)/(Nt*Δt)=2/(1000*500)=4*10 -6 1/ч, то есть за 1 час может отказать 4-е элемента из миллиона.
Показатели интенсивности отказов l(t) элементов являются справочными данными, в приложении Г приводятся интенсивности отказов l(t) для элементов, часто применяемых в схемах.
Электротехническое устройство состоит из большого числа комплектующих элементов, поэтому определяют эксплуатационную интенсивность отказов l(t) всего устройства как сумму интенсивностей отказов всех элементов, по формуле [ 11]
где k – поправочный коэффициент, учитывающий относительное изменение средней интенсивности отказов элементов в зависимости от назначения устройства;
m – общее количество групп элементов;
n і - количество элементов в і- й группе с одинаковой интенсивностью отказов l і (t) .
Вероятность безотказной работы P(t) представляет собой вероятность того, что в пределах указанного периода времени t , отказ устройства не возникнет. Этот показатель определяется отношение числа устройств, безотказно проработавших до момента времени t к общему числу устройств, работоспособных в начальный момент.
Например, вероятность безотказной работы P(t) =0,9 представляет собой вероятность того, что в пределах указанного периода времени t= 500час, отказ произойдет в (10-9=1) одном устройстве из десяти, и из 10 устройств 9 будут работать без отказов.
Вероятность безотказной работы P(t) =0,8 представляет собой вероятность того, что в пределах указанного периода времени t=1000час, отказ произойдет двух 2 устройствах из ста, и из 100 устройств 80 устройств будут работать без отказов.
Вероятность безотказной работы P(t) =0,975 представляет собой вероятность того, что в пределах указанного периода времени t=2500час, отказ произойдет в 1000-975=25 устройствах из тысячи, а 975 устройств будут работать без отказов.
Количественно надёжность устройства оценивается как вероятность P(t) события, заключающегося в том, что устройство в течение времени от 0 до t будет безотказно выполнять свои функции. Величина P(t) вероятность безотказной (рассчитанное значение Р(t) не должно быть менее 0,85) работы определяется выражением
где t – время работы системы, ч (t выбирается из ряда: 1000, 2000, 4000, 8000, 10000 ч.);
λ – интенсивность отказов устройства, 1 / ч;
Т 0 – наработка на отказ, ч.
Расчёт надёжности заключается в нахождении общей интенсивности отказов λ устройства и наработки на отказ:
Время восстановления устройства при отказе включает в себя время поиска неисправного элемента, время его замены или ремонта и время проверки работоспособности устройства.
Среднее время восстановления Т в электротехнических устройств может выбираться из ряда 1, 2, 4, 6, 8, 10, 12, 18, 24, 36, 48 час. Меньшие значения соответствуют устройствам с высокой ремонтнотпригодностью. Среднее время восстановления Т в можно уменьшить используя встроенный контроль или самодиагностику, модульное исполнение составных частей, доступный монтаж.
Значение коэффициента готовности определяется по формуле
где Т 0 – наработка на отказ, ч.
Т в – среднее время восстановления, ч.
Надёжность элементов в значительной степени зависит от их электрических и температурных режимов работы. Для повышения надёжности элементы необходимо использовать в облегченных режимах, определяемых коэффициентами нагрузки.
Коэффициент нагрузки – это отношение расчетного параметра элемента в рабочем режиме к его максимально допустимому значению. Коэффициенты нагрузки различных элементов могут сильно отличаться.
При расчёте надежности устройства все элементы системы разбиваются на группы элементов одного типа и одинаковыми коэффициентами нагрузки К н.
Интенсивность отказа і- го элемента определяется по формуле
(10.3)
где К н і - коэффициент нагрузки, рассчитывают в картах рабочих режимов, либо задают полагая, что элемент работает в нормальных режимах, в приложении Г приводятся значения коэффициентов нагрузки элементов;
λ 0і – базовая интенсивность отказов і - го элемента приводится в приложении Г.
Часто, для расчета надежности, используются данные интенсивности отказа λ 0і аналогов элементов.
Пример расчета надежности устройства состоящего из покупного комплекса BT-85W импортного производства и разрабатываемого на элементной базе серийного производства источника питания.
Интенсивности отказов изделий импортного производства определяют, как обратную величину времени эксплуатации, (иногда берут гарантийный срок обслуживания изделия) из расчета эксплуатации в одни сутки определенного числа часов.
Гарантийный срок службы покупного импортного изделия 5 лет, изделие будет работать 14,24часа в сутки:
Т=14,24час х 365дней х 5 лет = 25981 часов – время наработки на отказ.
10 -6 1/час - интенсивность отказов.
Расчёты и исходные данные выполняют на ЭВМ с использованием программ Excel и приводятся в таблицах 10.1 и 10.2. Пример расчета приводится в таблице 10.1.
Таблица 10.1 – Расчет надежности системы
Наименование и тип элемента или аналога | Коэффи-циент, нагрузки, К н i | ||||
λ i *10 -6 , 1 / ч | λ i *К н i *10 -6 1 / ч | Кол-во n i , | n і *λ i *10 -6 , 1 / ч | ||
Комплекс BT-85W | 1,00 | 38,4897 | 38,4897 | 38,4897 | |
Конденсатор К53 | 0,60 | 0,0200 | 0,0120 | 0,0960 | |
Розетка (вилка)СНП268 | 0,60 | 0,0500 | 0,0300 | 0,0900 | |
Микросхема TRS | 0,50 | 0,0460 | 0,0230 | 0,0230 | |
Резистор ОМЛТ | 0,60 | 0,0200 | 0,0120 | 0,0120 | |
Вставка плавкая ВП1-1 | 0,30 | 0,1040 | 0,0312 | 0,0312 | |
Стабилитрон 12В | 0,50 | 0,4050 | 0,2500 | 0,4050 | |
Индикатор 3Л341Г | 0,20 | 0,3375 | 0,0675 | 0,0675 | |
Кнопочный выключатель | 0,30 | 0,0100 | 0, 0030 | 0,0030 | |
Фотодиод | 0,50 | 0,0172 | 0,0086 | 0,0086 | |
Соединение сваркой | 0,40 | 0,0001 | 0,0004 | 0,0004 | |
Провод, м | 0,20 | 0,0100 | 0,0020 | 0,2 | 0,0004 |
Соединение пайкой | 0,50 | 0,0030 | 0,0015 | 0,0045 | |
l всего устройства | å=39,2313 |
Определяем общую интенсивность отказов устройства
Тогда наработка на отказ согласно выражению (10.2) и соответственно равна
Для определения вероятности безотказной работы за определенный промежуток времени построим график зависимости:
Таблица 10.2 - Расчет вероятности безотказной работы
t(час) | |||||||||
P(t) | 0,97 | 0,9 | 0,8 | 0,55 | 0,74 | 0,65 | 0,52 | 0,4 | 0,34 |
График зависимости вероятности безотказной работы от времени работы показан на рисунке 10.1.
Рисунок 10.1 – Вероятность безотказной работы от времени работы
Для устройства, как правило задают вероятность безотказной работы от 0,82 до 0,95. По графику рисунка 10.1 можем определить для разработанного устройства при заданной вероятности безотказной работы Р(t)=0,82, время наработки на отказ Т о =5000час.
Расчет выполнен для случая, когда отказ любого элемента приводит к отказу всей системы в целом, такое соединение элементов называется логически последовательным или основным. Надежность можно повысить резервированием.
Например . Технология элементов обеспечивает среднюю интенсивность отказов элементарных деталей l i =1*10 -5 1/ч . При использовании в устройстве N=1*10 4 элементарных деталей суммарная интенсивность отказов lо= N*li=10 -1 1/ч . Тогда среднее время безотказной работы устройства To=1/lо=10 ч. Если выполнить устройство на основе 4-х параллельно включенных одинаковых устройств, то среднее время безотказной работы увеличится в N/4=2500 раз и составит 25000 ч. или 34 месяца или около 3 лет.
Формулы позволяют выполнить расчет надежности устройства, если известны исходные данные - состав устройства, режим и условия его работы, интенсивности отказов его элементов.
Различают вероятностные (математические) и статистические показатели надежности. Математические показатели надежности выводятся из теоретических функций распределения вероятностей отказов. Статистические показатели надежности определяются опытным путем при испытаниях объектов на базе статистических данных эксплуатации оборудования.
Надежность является функцией многих факторов, большинство из которых случайны. Отсюда ясно, что для оценки надежности объекта необходимо большое количество критериев.
Критерий надежности – это признак, по которому оценивается надежность объекта.
Критерии и характеристики надежности носят вероятностный характер, поскольку факторы, влияющие на объект, носят случайный характер и требуют статистической оценки.
Количественными характеристиками надежности могут быть:
вероятность безотказной работы;
среднее время безотказной работы;
интенсивность отказов;
частота отказов;
различные коэффициенты надежности.
1. Вероятность безотказной работы
Служит одним из основных показателей при расчетах на надежность.
Вероятность безотказной работы объекта называется вероятность того, что он будет сохранять свои параметры в заданных пределах в течение определенного промежутка времени при определенных условиях эксплуатации.
В дальнейшем полагаем, что эксплуатация объекта происходит непрерывно, продолжительность эксплуатации объекта выражена в единицах времени t и эксплуатация начата в момент времени t=0.
Обозначим P(t) вероятность безотказной работы объекта на отрезке времени . Вероятность, рассматриваемую как функцию верхней границы отрезка времени, называют также функцией надежности.
Вероятностная оценка: P(t) = 1 – Q(t), где Q(t) — вероятность отказа.
Из графика очевидно, что:
1. P(t) – невозрастающая функция времени;
2. 0 ≤ P(t) ≤ 1;
3. P(0)=1; P(∞)=0.
На практике иногда более удобной характеристикой является вероятность неисправной работы объекта или вероятность отказа:
Q(t) = 1 – P(t).
Статистическая характеристика вероятности отказов: Q*(t) = n(t)/N
2. Частота отказов
Частотой отказов называется отношение числа отказавших объектов к их общему числу перед началом испытания при условии что отказавшие объекты не ремонтируются и не заменяются новыми, т.е
a*(t) = n(t)/(NΔt)
где a*(t) — частота отказов;
n(t) – число отказавших объектов в интервале времени от t – t/2 до t+ t/2;
Δt – интервал времени;
N – число объектов, участвующих в испытании.
Частота отказов есть плотность распределения времени работы изделия до его отказа. Вероятностное определение частоты отказов a(t) = -P(t) или a(t) = Q(t).
Таким образом, между частотой отказов, вероятностью безотказной работы и вероятностью отказов при любом законе распределения времени отказов существует однозначная зависимость: Q(t) = ∫ a(t)dt.
Отказ трактуют в теории надежности как случайное событие. В основе теории лежит статистическое истолкование вероятности. Элементы и образованные из них системы рассматривают как массовые объекты, принадлежащие одной генеральной совокупности и работающие в статистически однородных условиях. Когда говорят об объекте, то в сущности имеют в виду наугад взятый объект из генеральной совокупности, представительную выборку из этой совокупности, а часто и всю генеральную совокупность.
Для массовых объектов статистическую оценку вероятности безотказной работы P(t) можно получить, обработав результаты испытаний на надежность достаточно больших выборок. Способ вычисления оценки зависит от плана испытаний.
Пусть испытания выборки из N объектов проведены без замен и восстановлений до отказа последнего объекта. Обозначим продолжительности времени до отказа каждого из объектов t 1 , …, t N . Тогда статистическая оценка:
P*(t) = 1 — 1/N ∑η(t-t k)
где η — единичная функция Хевисайда.
Для вероятности безотказной работы на определенном отрезке удобна оценка P*(t) = /N,
где n(t) – число объектов, отказавших к моменту времени t.
Частота отказов, определяемая при условии замены отказавших изделий исправными, иногда называется средней частотой отказов и обозначается ω(t).
3. Интенсивность отказов
Интенсивностью отказов λ(t) называется отношение числа отказавших объектов в единицу времени к среднему числу объектов, работающих в данный отрезок времени, при условии, что отказавшие объекты не восстанавливаются и не заменяются исправными: λ(t) = n(t)/
где N ср = /2 — среднее число объектов, исправно работавших в интервале времени Δt;
N i – число изделий, работавших в начале интервала Δt;
N i+1 – число объектов, исправно работавших в конце интервала времени Δt.
Ресурсные испытания и наблюдения над большими выборками объектов показывают, что в большинстве случаев интенсивность отказов изменяется во времени немонотонно.
Из кривой зависимости отказов от времени видно, что весь период работы объекта можно условно поделить на 3 периода.
I — й период – приработка.
Приработочные отказы являются, как правило, результатом наличия у объекта дефектов и дефектных элементов, надежность которых значительно ниже требуемого уровня. При увеличении числа элементов в изделии даже при самом строгом контроле не удается полностью исключить возможность попадания в сборку элементов, имеющих те или иные скрытые дефекты. Кроме того, к отказам в этот период могут приводить и ошибки при сборке и монтаже, а также недостаточная освоенность объекта обслуживающим персоналом.
Физическая природа таких отказов носит случайный характер и отличается от внезапных отказов нормального периода эксплуатации тем, что здесь отказы могут иметь место не при повышенных, а и при незначительных нагрузках («выжигание дефектных элементов»).
Снижение величины интенсивности отказов объекта в целом, при постоянном значении этого параметра для каждого из элементов в отдельности, как раз и объясняется «выжиганием» слабых звеньев и их заменой наиболее надежными. Чем круче кривая на этом участке, тем лучше: меньше дефектных элементов останется в изделии за короткий срок.
Чтобы повысить надежность объекта, учитывая возможность приработочных отказов, нужно:
проводить более строгую отбраковку элементов;
проводить испытания объекта на режимах близких к эксплуатационным и использовать при сборке только элементы, прошедшие испытания;
повысить качество сборки и монтажа.
Среднее время приработки определяют при испытаниях. Для особо важных случаев необходимо увеличить срок приработки в несколько раз по сравнению со средним.
II — й период – нормальная эксплуатация
Этот период характеризуется тем, что приработочные отказы уже закончились, а отказы, связанные с износом, еще не наступили. Этот период характеризуется исключительно внезапными отказами нормальных элементов, наработка на отказ которых очень велика.
Сохранение уровня интенсивности отказов на этом этапе характеризуется тем, что отказавший элемент заменяется таким же, с той же вероятностью отказа, а не лучшим, как это происходило на этапе приработки.
Отбраковка и предварительная обкатка элементов, идущих на замену отказавших, имеет для этого этапа еще большее значение.
Наибольшими возможностями в решении этой задачи обладает конструктор. Нередко изменение конструкции или облегчение режимов работы всего одного-двух элементов обеспечивает резкое повышение надежности всего объекта. Второй путь – повышение качества производства и даже чистоты производства и эксплуатации.
III – й период – износ
Период нормальной эксплуатации заканчивается, когда начинают возникать износовые отказы. Наступает третий период в жизни изделия – период износа.
Вероятность возникновения отказов из-за износов с приближением к сроку службы возрастает.
С вероятностной точки зрения отказ системы в данном промежутке времени Δt = t 2 – t 1 определяется как вероятность отказа:
∫a(t) = Q 2 (t) — Q 1 (t)
Интенсивность отказов есть условная вероятность того, что в промежуток времени Δt произойдет отказ при условии, что до этого он не произошел λ(t) = /[ΔtP(t)]
λ(t) = lim /[ΔtP(t)] = / = Q"(t)/P(t) = -P"(t)/P(t)
так как a(t) = -P"(t), то λ(t) = a(t)/P(t).
Эти выражения устанавливают зависимость между вероятностью безотказной работы, частотой и интенсивностью отказов. Если a(t) – невозрастающая функция, то справедливо соотношение:
ω(t) ≥ λ(t) ≥ a(t).
4. Среднее время безотказной работы
Средним временем безотказной работы называется математическое ожидание времени безотказной работы.
Вероятностное определение: среднее время безотказной работы равно площади под кривой вероятности безотказной работы.
Статистическое определение: T* = ∑θ i /N 0
где θ I – время работы i-го объекта до отказа;
N 0 – начальное число объектов.
Очевидно, что параметр Т* не может полностью и удовлетворительно характеризовать надежность систем длительного пользования, так как является характеристикой надежности только до первого отказа. Поэтому надежность систем длительного использования характеризуют средним временем между двумя соседними отказами или наработкой на отказ t ср:
t ср = ∑θ i /n = 1/ω(t),
где n – число отказов за время t;
θ i – время работы объекта между (i-1)-м и i-м отказами.
Наработка на отказ – среднее значение времени между соседними отказами при условии восстановления отказавшего элемента.
При рассмотрении законов распределения отказов было выяснено, что интенсивности отказов элементов могут быть либо постоянными, либо меняться в зависимости от времени эксплуатации. Для систем длительного использования, к которым относятся все транспортные системы, предусматривается профилактическое обслуживание, что практически исключает влияние износовых отказов, поэтому возникают только внезапные отказы.
Это в значительной мере упрощает расчет надежности. Однако сложные системы состоят из множества элементов, соединенных различным способом. Когда система находится эксплуатации, некоторые ее элементы работают непрерывно, другие - только в определенные промежутки времени, третьи - выполняют лишь короткие операции включения или подключения. Следовательно, в течение заданного промежутка времени лишь у части элементов время работы совпадает со временем работы системы, другие же работают более короткое время.
В этом случае для расчета наработки заданной системы рассматривается только время, в течение которого элемент включен; такой подход возможен, если допустить, что в течение периодов, когда элементы не включены в работу системы, их интенсивность отказов равна нулю.
С точки зрения надежности наиболее распространена схема последовательного соединения элементов. В этом случае при расчете используется правило произведения надежностей:
где R (t i) - надежность i-го элемента, который включается на t i часов из общего времени работы системы t ч .
Для расчетов может быть использован так называемый
коэффициент занятости, равный
т. е. отношению времени работы элемента ко времени работы системы. Практический смысл этого коэффициента состоит в том, что для элемента с известной интенсивностью отказов интенсивность отказов в системе с учетом времени работы будет равна
Такой же подход может быть использован по отношению к отдельным узлам системы.
Другим фактором, который следует учитывать при анализе надежности системы, является уровень рабочей нагрузки, с которой элементы работают в системе, так как он в значительной мере определяет величину ожидаемой интенсивности отказов.
Интенсивность отказов элементов существенно меняется даже при небольших изменениях рабочей нагрузки, воздействующей на них.
В данном случае основное затруднение при расчете вызывается многообразием факторов, определяющий как понятие прочности элемента, так и понятие нагрузки.
Прочность элемента объединяет его сопротивление механическим нагрузкам, вибрациям, давлению, ускорению и т. д. К категории прочности относятся также сопротивления тепловым нагрузкам, электрическая прочность, влагостойкость, стойкость против коррозии и ряд других свойств. Поэтому прочность не может быть выражена некоторой числовой величиной и нет единиц измерения прочности, учитывающих все эти факторы. Также многообразны проявления нагрузки. Поэтому для оценки прочности и нагрузки используются статистические методы, с помощью которых определяется наблюдаемый эффект отказа элемента во времени под действием ряда нагрузок или под действием преимущественной нагрузки.
Элементы проектируются так, чтобы они могли выдержать номинальные нагрузки. При эксплуатации элементов в условиях номинальных нагрузок наблюдается определенная закономерность интенсивности их внезапных отказов. Эта интенсивность называется номинальной интенсивностью внезапных отказов элементов, и она является исходной величиной для определения действительной интенсивности внезапных отказов реального элемента (с учетом времени работы и рабочей нагрузки).
Для реального элемента или системы в настоящее время учитываются три основных воздействия окружающей среды: механические, тепловые и рабочие нагрузки.
Влияние механических воздействий учитывается коэффициентом , величина которого определяется местом установки аппаратуры, и может быть принята равной:
для лабораторий и благоустроенных помещений - 1
, стационарных наземных установок - 10
, железнодорожного подвижного состава - 30.
Номинальная интенсивность внезапных отказов, выбранная по
табл. 3, должна быть увеличена в раз в зависимости от места установки аппарата в эксплуатации.
Кривые рис. 7 иллюстрируют общий характер изменения интенсивности внезапных отказов электрических и электронных элементов в зависимости от температуры нагрева и величины рабочей нагрузки.
Интенсивность внезапных отказов с увеличением рабочей нагрузки,как видно из приведенных кривых, возрастает по логарифмическому закону. Из этих кривых также видно, каким образом можно уменьшить интенсивность внезапных отказов элементов даже до величины, меньшей номинального значения. Существенное сокращение интенсивности внезапных отказов достигается в том случае, если элементы работают при нагрузках ниже номинальных значений.
Рис. 16
Рис. 7 может быть использован при проведении ориентировочных (учебных) расчетов надежности любых электрических и электронных элементов. Номинальному режиму в этом случае соответствует температура 80°С и 100% рабочей нагрузки.
Если расчетные параметры элемента отличаются от номинальных значений, то по кривым рис. 7 может быть определено увеличение для выбранных параметров и получено отношение на которое и умножается величина интенсивности отказов рассматриваемого элемента.
Высокая надежность может быть заложена при проектировании элементов и систем. Для этого необходимо стремиться к уменьшению температуры элементов при работе и применять элементы с повышенными номинальными параметрами, что равносильно снижению рабочих нагрузок.
Увеличение стоимости изготовления изделия в любом случае окупается за счет сокращения эксплуатационных расходов.
Интенсивность отказов для элементов электрических це-
пей в зависимости от нагрузки может быть определена так
же по эмпирическим формулам. В частности, в зависимости
от рабочего напряжения и температуры
Табличное значение при номинальном напряжении и температуре t i .
- интенсивность отказов при рабочем напряжении U 2 и температуре t 2 .
Предполагается, что механические воздействия остаются на прежнем уровне. В зависимости от вида и типа элементов значение п, меняется от 4 до 10, а значение К в пределах 1,02 1,15.
При определении реальной интенсивности отказов элементов необходимо хорошо представлять величину ожидаемых уровней нагрузок, при которых элементы будут работать, рассчитать величины электрических и тепловых параметров с учетом переходных режимов. Правильное выявление нагрузок, воздействующих на отдельные элементы, приводит к значительному повышению точности расчета надежности.
При расчете надежности с учетом износовых отказов необходимо также учитывать условие эксплуатации. Значения долговечности М, приведенные в табл. 3, так же как и относятся к номинальному режиму нагрузки и лабораторным условиям. Все элементы, работающие в других условиях, имеют долговечность, отличающуюся от ной на величину К Величина К может быть принята равной:
для лаборатории - 1,0
, наземных установок - 0,3
, железнодорожного подвижного состава - 0,17
Небольшие колебания коэффициента К возможны для аппаратуры различного назначения.
Для определения ожидаемой долговечности М необходимо среднюю (номинальную) долговечность, определенную по таблице, умножить на коэффициент К .
При отсутствии материалов, необходимых для определения интенсивности отказов в зависимости от уровней нагрузки, может быть использован коэффициентный метод расчета интенсивности отказов.
Сущность коэффициентного метода расчета сводится к тому, что при расчете критериев надежности аппаратуры используются коэффициенты, связывающие интенсивность отказов элементов различных типов с интенсивностью отказов элемента, характеристики надежности которого достоверно известны.
Предполагается, что справедлив экспоненциальный закон надежности, а интенсивности отказов элементов всех типов изменяются в зависимости от условий эксплуатации в одинаковой степени. Последнее допущение означает, что при различных условиях эксплуатации справедливо соотношение
Интенсивность отказов элемента, количественные характеристики которого известны;
Коэффициент надежности i-го элемента. Элемент с интенсивностью отказов ^ 0 называется основным элементом расчета системы. При вычислении коэффициентов K i за основной элемент расчета системы принимается проволочное_нерегулируемое сопротивление. В данном случае для расчета надежности системы не требуется знать интенсивность отказа элементов всех типов. Достаточно знать лишь коэффициенты надежности K i , число элементов в схеме и интенсивность отказов основного элемента расчета Так как K i имеет разброс значений, то надежность проверяется как для К min , так и для К мах. Значения K i , определенные на основании анализа данных по интенсивностям отказов, для аппаратуры различного назначения приведены в табл. 5.
Таблица 5
Интенсивность отказов основного элемента расчета (в данном случае сопротивления) следует определять как средневзвешенное значение интенсивностей отказов сопротивлений, применяемых в проектируемой системе, т. е.
И N R - интенсивность отказов и количество сопротивлений i-го типа и номинала;
т - число типов и номиналов сопротивлений.
Построение результирующей зависимости надежности системы от времени эксплуатации желательно производить как для значений К min , так и для К мах
Располагая сведениями о надежности отдельных элементов, входящих в систему, можно дать общую оценку надежности системы и определить блоки и узлы, требующие дальнейшей доработки. Для этого исследуемая система разбивается на узлы по конструктивному либо смысловому признаку (составляется структурная схема). Для каждого выбранного узла определяется надежность (узлы, имеющие меньшую надежность требуют доработки и усовершенствования в первую очередь).
При сравнении надежности узлов, а тем более различных вариантов систем, следует помнить, что абсолютная величина надежности не отражает поведения системы в эксплуатации и ее эффективности. Одна и та же величина надежности системы может быть достигнута в одном случае за счет основных элементов, ремонт и смена которых требует значительного времени и больших материальных затрат (для электровоза-отстранение от поездной работы), в другом случае это мелкие элементы, смена которых производится обслуживающим персоналом без отстранения машины от работы. Поэтому для сравнительного анализа проектируемых систем рекомендуется сравнивать надежности элементов, аналогичных по своему значению и последствиям, возникающим в результате их отказов.
При ориентировочных расчетах надежности можно пользоваться данными опыта эксплуатации аналогичных систем. что в какой-то мере учитывает условия эксплуатации. Расчет в этом случае может осуществляться двумя путями: по среднему уровню надежности однотипной аппаратуры или покоэффициенту пересчета к реальным условиям эксплуатации.
В основе расчета по среднему уровню надежности лежит предположение, что проектируемой аппаратуры и эксплуатируемого образца равны. Это можно допустить при одинаковых элементах, аналогичных системах и одинаковом соотношении элементов в системе.
Сущность метода состоит в том, что
И - число элементов и наработка на отказ аппаратуры - образца;
И - то же проектируемой аппаратуры. Из данного соотноше-ния легко определить наработку на отказ для проектируемой ап-паратуры:
Достоинство метода - простота. Недостатки - отсутствие, как правило, образца эксплуатируемой аппаратуры, пригодного для сравнения с проектируемым устройством.
В основе расчета по второму способу лежит определение коэффициента пересчета, учитывающего условия эксплуатации аналогичной аппаратуры. Для его определения выбирается аналогичная система, эксплуатируемая в заданных условиях. Остальные требования могут не соблюдаться. Для выбранной эксплуатируемой системы определяются показатели надежности с использованием данных табл. 3, отдельно определяются те же показатели по эксплуатационным данным.
Коэффициент пересчета определяется как отношение
- наработка на отказ по данным эксплуатации;
Т оз - наработка на отказ по расчету.
Для проектируемой аппаратуры расчет показателей надежности производится с использованием тех же табличных данных, что идля эксплуатируемой системы. После чего полученные результаты умножаются на К э.
Коэффициент К э учитывает реальные условия эксплуатации,- профилактические ремонты и их качество, замены деталей между ремонтами, квалификацию обслуживающего персонала, состояние оборудования депо и т. д., чего нельзя предусмотреть при других способах расчета. Значения К э могут быть и больше единицы.
Любой из рассмотренных методов расчета может быть произведен на заданную надежность, т. е. методом от противного - от надежности системы и наработки на отказ к выбору показателей составляющих элементов.
Интенсивность отказов - условная плотность вероятности возникновения отказа невосстанавливаемого объекта, определяемая для рассматриваемого момента времени при условии, что до этого момента отказ не возник.
Таким образом, статистически интенсивность отказов равна числу отказов, происшедших за единицу времени, отнесенному к числу не отказавших к данному моменту объектов.
Типичное изменение интенсивности отказов во времени показано на рис. 5.
Опыт эксплуатации сложных систем показывает, что изменение интенсивности отказов λ(t ) большинства количества объектов описывается U - образной кривой.
Время можно условно разделить на три характерных участка: 1. Период приработки. 2. Период нормальной эксплуатации. 3. Период старения объекта.
Рис. 5. Типичное изменение интенсивности отказов
Период приработки объекта имеет повышенную интенсивность отказов, вызванную приработочными отказами, обусловленными дефектами производства, монтажа и наладки. Иногда с окончанием этого периода связывают гарантийное обслуживание объекта, когда устранение отказов производится изготовителем. В период нормальной эксплуатации интенсивность отказов практически остаётся постоянной, при этом отказы носят случайный характер и появляются внезапно, прежде всего, из-за случайных изменений нагрузки, несоблюдения условий эксплуатации, неблагоприятных внешних факторов и т.п. Именно этот период соответствует основному времени эксплуатации объекта.
Возрастание интенсивности отказов относится к периоду старения объекта и вызвано увеличением числа отказов из-за износа, старения и других причин, связанных с длительной эксплуатацией. То есть вероятность отказа элемента, дожившего для момента t в некотором последующем промежутке времени зависит от значений λ(u ) только на этом промежутке, а следовательно интенсивность отказов - локальный показатель надёжности элемента на данном промежутке времени.
Тема 1.3. Надежность восстанавливаемых систем
Современные системы автоматики относятся к сложным восстанавливаемым системам. Такие системы в процессе работы, при отказе некоторых элементов ремонтируются и продолжают дальнейшую работу. Свойство систем восстанавливаться в процессе работы "закладывается" при их проектировании и обеспечивается при изготовлении, а проведение ремонтно-восстановительных операций предусмотрено в нормативно- технической документации.
Проведение ремонтно-восстановительных мероприятий является по существу еще одним способом, направленным на повышение надежности системы.
1.3.1. Показатели надежности восстанавливаемых систем
С количественной стороны такие системы кроме рассмотренных ранее показателей надежности, характеризуются еще и комплексными показателями надежности.
Комплексным показателем надежности является показатель надежности, характеризующий несколько свойств, составляющих надежность объекта.
Комплексными показателями надежности, которые наиболее широко применяются при характеристике надежности восстанавливаемых систем, являются:
Коэффициент готовности;
Коэффициент оперативной готовности;
Коэффициент технического использования.
Коэффициент готовности - вероятность того, что объект окажется в работоспособном состоянии в произвольный момент времени, кроме планируемых перерывов, в течении которых применение объекта по назначению не предусматривается.
Таким образом, коэффициент готовности характеризует одновременно два различных свойства объекта - безотказность и ремонтопригодность.
Коэффициент готовности является важным параметром, однако, он не является универсальным.
Коэффициент оперативной готовности - вероятность того, что объект окажется в работоспособном состоянии в произвольный момент времени, кроме планируемых перерывов, в течение которых применение объекта по назначению не предусматривается, и, начиная с этого момента, будет работать безотказно в течение заданного интервала времени.
Коэффициент характеризует надежность объектов, необходимость применения которых возникает в произвольный момент времени, после которого требуется определенная безотказная работа. До этого момента аппаратура может находиться в режиме дежурства, режим применения в других рабочих функциях.
Коэффициент технического использования - отношение математического ожидания интервалов времени пребывания объектов в работоспособном состоянии за некоторый период эксплуатации к сумме математических ожиданий интервалов времени пребывания объекта в работоспособном состоянии, простоев, обусловленных техническим обслуживанием, и ремонтов за тот же период эксплуатации.