Tasa general de fallas del sistema. Fiabilidad y supervivencia de los sistemas informáticos a bordo (btsvs)

Fiabilidad y supervivencia de los sistemas informáticos a bordo (BCVS).

La confiabilidad es la propiedad de los productos para realizar las funciones requeridas, manteniendo sus indicadores de desempeño dentro de los límites especificados durante el período de tiempo requerido.

Capacidad de supervivencia: la capacidad de un sistema informático para realizar sus funciones principales, a pesar del daño recibido y los elementos de hardware fallidos.

Se imponen requisitos más estrictos a la fiabilidad y supervivencia de BUVM y BCVS que a la fiabilidad y supervivencia de las computadoras personales y de uso general. Si la computadora de a bordo falla, la operatividad del sistema se interrumpe y las tareas asignadas no se realizan, lo que puede llevar a consecuencias irreparables, incluidas víctimas humanas.

Resolver el problema después de restaurar la computadora de a bordo y la computadora de a bordo es a menudo imposible. Entonces, por ejemplo, si el BCVS de un sistema de misiles antiaéreos falla, el objeto defendido será destruido. Y, si restaura el sistema para que funcione en poco tiempo, la destrucción no podrá regresar de la misma manera que las vidas perdidas. La falla en la aviónica puede provocar un accidente aéreo o misiles espontáneos. En este caso, el restablecimiento de la operación BCVS tampoco permitirá corregir las consecuencias del error.

Garantizar una alta fiabilidad y supervivencia del BCVS se complica por las condiciones de funcionamiento del equipo a bordo con grandes fluctuaciones de temperatura, humedad, cargas mecánicas y en condiciones de alto contenido de polvo. Se impone la misma limitación sobre las dimensiones y el peso del equipo. Esto se aplica principalmente a la aviación, pero también es de gran importancia para el BCVS en otras áreas.

Por tanto, el problema de la fiabilidad y supervivencia del ordenador de a bordo y el ordenador de a bordo tiene una serie de características debido a la singularidad de la estructura del ordenador de a bordo y la naturaleza de las funciones que realizan.

La tarea de proporcionar alta confiabilidad y capacidad de supervivencia en un sistema complejo puede ser muy costosa, compleja y requiere mucho tiempo, aunque las dificultades con la producción y los problemas que surgen durante la operación, debido a la necesidad de asegurar y mantener el nivel requerido de confiabilidad, pueden causar aún más dificultades. ...

Por ejemplo, si la confiabilidad de un sistema de misiles se reduce en un 10%, para garantizar el mismo grado de destrucción del objetivo, se requerirá un aumento de al menos un 10% en el número real de misiles de combate. Estos misiles requieren plataformas de lanzamiento adicionales, equipo de prueba, equipo de lanzamiento, personal de mantenimiento y equipo auxiliar, lo cual es costoso y requiere mucho tiempo.

Cuanto más compleja sea la estructura de un sistema informático, más difícil será garantizar la fiabilidad y la supervivencia. Cabe señalar que la mayoría de las fallas que se han producido durante los lanzamientos de misiles guiados y satélites artificiales en los Estados Unidos no fueron causadas por un mal funcionamiento de ningún dispositivo exótico, cuyo diseño ha acelerado el progreso del estado de la técnica. Por el contrario, muchas fallas fueron causadas por el mal funcionamiento de elementos funcionales y estructurales de un diseño previamente aprobado. A veces los elementos se hicieron incorrectamente y en otros casos hubo errores en el trabajo de los programadores o del personal de mantenimiento. No hay nada tan pequeño que sea demasiado insignificante para no ser una posible razón de rechazo. El alto potencial y la confiabilidad alcanzable son en gran parte el resultado de una atención profunda y cuidadosa a los detalles.

El problema de aumentar la confiabilidad y la tolerancia a fallas es característico no solo del BCVS, sino también de los equipos comerciales. Por ejemplo, en un clúster de Google, en promedio, 1 computadora falla por día (es decir, aproximadamente el 3% de las computadoras fallan durante un año). Por supuesto, debido a la redundancia de datos y código, estos fallos son invisibles para los usuarios, pero para el programador son un gran problema.

El caso en el que un sistema informático o su parte está averiado y es imposible seguir trabajando sin una reparación se denomina fallo.

La teoría de la confiabilidad distingue entre 3 signos característicos de fallas que pueden ser inherentes al equipo y aparecer sin ninguna influencia de las personas.

1. Fallos de rodaje. Estas fallas ocurren durante el período inicial de operación y en la mayoría de los casos son causadas por una falta de tecnología de fabricación y defectos en la fabricación de elementos de los sistemas informáticos. Estas fallas se pueden eliminar mediante el proceso de rechazo, rodaje y pruebas tecnológicas del producto terminado.

2. Fallos defectuosos o graduales. Son fallas que surgen del desgaste de parámetros individuales o partes del equipo. Se caracterizan por un cambio gradual en los parámetros del producto o elementos. Inicialmente, estas fallas pueden manifestarse como fallas temporales. Sin embargo, a medida que aumenta el desgaste, las fallas temporales se convierten en fallas graves de hardware. Estas fallas son una señal del envejecimiento del BCVS. Pueden eliminarse parcialmente con un funcionamiento adecuado, una buena prevención y el reemplazo oportuno de equipos desgastados.

3. Fallos repentinos o catastróficos. Estas fallas no se pueden eliminar mediante la depuración de hardware, el mantenimiento adecuado o el mantenimiento preventivo. Los fallos repentinos ocurren por casualidad, nadie puede predecirlos, sin embargo, obedecen a ciertas leyes de probabilidad. Entonces, la frecuencia de fallas repentinas se vuelve aproximadamente constante durante un período de tiempo suficientemente largo. Esto sucede en cualquier hardware. Un ejemplo de fallas aleatorias son circuitos abiertos o cortocircuitos. Una falla de este tipo generalmente conduce al hecho de que se establece permanentemente en la salida 0 o 1. En caso de fallas aleatorias, es necesario reemplazar los elementos en los que ocurrieron. Para ello, el sistema informático debe poder mantenerse y permitir un rápido mantenimiento preventivo en el campo.

Las fallas intermitentes o las fallas se pueden distinguir en un grupo separado. Falla significa una interrupción a corto plazo del funcionamiento normal de la computadora de a bordo, en la que uno o más de sus elementos, al realizar una o más operaciones adyacentes, dan un resultado aleatorio. Después de una falla, el sistema informático puede funcionar normalmente durante mucho tiempo.

La causa de las fallas pueden ser interferencias electromagnéticas, influencias mecánicas, etc. Las fallas a menudo no conducen a la falla del complejo, sino que solo cambian el curso del software debido a la ejecución incorrecta de uno o más comandos, lo que puede tener consecuencias catastróficas. La diferencia entre fallas y fallas es que cuando se detectan las consecuencias de una falla, es necesario restaurar no el equipo, sino la información distorsionada por la falla.

Hablando de fallas, es necesario mencionar los llamados Schroedinbugs. Schroedinbag es un error en el que el sistema informático funciona normalmente durante mucho tiempo, sin embargo, bajo ciertas condiciones, por ejemplo, al establecer parámetros operativos no estándar, se produce una falla. Al analizar esta falla, resulta que el software del sistema informático tiene un error fundamental por lo que, en principio, no debería funcionar.

Un schroedinbag puede estar formado por una combinación compleja de errores emparejados (cuando un error en un lugar se compensa con un error de la acción opuesta en otro lugar). Bajo un cierto conjunto de circunstancias, el equilibrio de errores se destruye, lo que conduce a la parálisis del trabajo.

Por lo tanto, BCVS se caracteriza por otra propiedad que determina su confiabilidad: funcionamiento sin errores o confiable. Por lo tanto, la confiabilidad del BCVS es una combinación de confiabilidad, confiabilidad de funcionamiento, supervivencia y mantenibilidad.

Los siguientes se utilizan como parámetros de fiabilidad:

1. Tasa de fallas -

2. Tiempo medio entre fallos -

3. Probabilidad de funcionamiento sin fallos durante un tiempo determinado - Р

4. Probabilidad de falla - Q

Tasa de fracaso

La tasa de fallas es la tasa a la que ocurren las fallas. Si el equipo consta de varios elementos, entonces su tasa de falla es igual a la suma de las tasas de falla de todos los elementos, cuyas fallas conducen a un mal funcionamiento del equipo.

La tasa de fallas frente al tiempo de operación se muestra en la siguiente figura.

Al inicio de la operación (en el momento t \u003d 0), se ponen en funcionamiento una gran cantidad de elementos. Esta colección de elementos puede tener inicialmente una alta tasa de fallas debido a muestras defectuosas. Dado que los elementos defectuosos fallan uno tras otro, la tasa de falla disminuye relativamente rápido durante el período de rodaje y se vuelve aproximadamente constante en el tiempo de operación normal (normas T), cuando los elementos defectuosos ya han fallado y han sido reemplazados por otros operables.

El conjunto de elementos que ha superado el rodaje presenta la menor tasa de averías, que se mantiene aproximadamente constante hasta el inicio de la avería de los elementos, por desgaste (T desgaste). A partir de este momento, la tasa de fallas comienza a aumentar.

Tiempo medio entre fallos

El tiempo medio entre fallas es la relación entre el total de horas trabajadas y el número total de fallas. Durante el período de operación normal, cuando la tasa de fallas es aproximadamente constante, el tiempo medio entre fallas es el inverso de la tasa de fallas:

Probabilidad de tiempo de actividad.

El tiempo de actividad es el número probable o esperado de dispositivos que funcionarán de manera confiable durante un período de tiempo determinado:

Esta fórmula es válida para todos los dispositivos que se han quemado pero que no se ven afectados por el desgaste. Por lo tanto, el tiempo t no puede exceder el período de funcionamiento normal de los dispositivos.

A continuación se muestra un gráfico que muestra la probabilidad de que no haya fallas en comparación con el tiempo de funcionamiento normal:

Probabilidad de fracaso.

La probabilidad de falla es el recíproco de la probabilidad de operación sin fallas.

La tasa de falla nominal.

Los elementos del equipo están diseñados para que puedan soportar ciertos nominales: voltaje, corriente, temperatura, vibración, humedad, etc. Cuando el equipo está expuesto a tales influencias durante el funcionamiento, existe una cierta tasa de falla. Esto se llama tasa de falla nominal.

Cuando la carga de trabajo total o algunas cargas privadas o los peligros ambientales aumentan más allá de los niveles nominales, la tasa de fallas aumenta considerablemente en comparación con su valor nominal. Por el contrario, la tasa de fallas disminuye cuando la carga cae por debajo del nivel nominal.

Por ejemplo, si un elemento va a operar a una temperatura nominal de 60 grados, entonces al bajar la temperatura como resultado del uso de un sistema de enfriamiento forzado, se puede reducir la tasa de falla. Sin embargo, si una disminución de la temperatura implica un aumento demasiado grande en el número de elementos y el peso del equipo, entonces puede ser más ventajoso seleccionar elementos con una temperatura de funcionamiento nominal aumentada y utilizarlos a una temperatura inferior a la nominal. En este caso, el equipo puede resultar más económico y la masa es menor (que es fundamentalmente cuando se trabaja en un avión) que cuando se utiliza un sistema de refrigeración forzada.

Métodos para determinar la confiabilidad de BCVS.

Cuando se diseñan y crean nuevos productos mediante mediciones mecánicas, eléctricas, químicas o de otro tipo, no se puede determinar un valor de tasa de falla. Las tasas de falla se pueden determinar recopilando datos estadísticos de las pruebas de confiabilidad de este o productos similares.

La probabilidad de funcionamiento sin fallos durante cualquier momento del tiempo de prueba se expresa mediante la fórmula:

La tasa de falla está determinada por la fórmula:

Al medir la tasa de fallas, es necesario mantener un número constante de elementos de prueba reemplazando los elementos fallados por otros nuevos.

Por lo tanto, para obtener datos sobre las características cuantitativas de la confiabilidad del equipo, es necesario realizar una muestra especial del equipo para las pruebas de confiabilidad. Las pruebas de confiabilidad deben llevarse a cabo en condiciones que correspondan a las condiciones de funcionamiento reales del equipo para influencias externas, la frecuencia de encendido y cambio de los parámetros de potencia.


En la etapa de cálculos aproximados y aproximados de dispositivos eléctricos, se calculan los principales indicadores de confiabilidad. .

Los principales indicadores de calidad y fiabilidad son:

Tasa de fracaso

Tiempo medio para fallar.

Tasa de fracaso l (t) es la cantidad de personas que se negaron n (t) de elementos del dispositivo por unidad de tiempo, referido al número total promedio de elementos N (t)operable por el tiempo Δ t[ 9]

l (t) \u003d n (t) / (Nt * Δt) ,

dónde Δt - un período de tiempo determinado.

por ejemplo: 1000 elementos del dispositivo funcionaron durante 500 horas. Durante este tiempo fallaron 2 elementos. Por lo tanto,

l (t) \u003d n (t) / (Nt * Δt) \u003d 2 / (1000 * 500) \u003d 4 * 10 -6 1 / h, es decir, en 1 hora, 4 elementos de un millón pueden fallar.

Tasas de fracaso l (t) Los elementos son datos de referencia, el Apéndice D da las tasas de falla l (t)para elementos de uso común en circuitos.

El dispositivo eléctrico consta de una gran cantidad de elementos componentes, por lo tanto, la tasa de falla operativa l (t) el dispositivo completo como la suma de las tasas de falla de todos los elementos, de acuerdo con la fórmula [11]

donde k es un factor de corrección que toma en cuenta el cambio relativo en la tasa promedio de falla de los elementos, dependiendo del propósito del dispositivo;

m es el número total de grupos de elementos;

n i - el número de elementos en el i-ésimo grupo con la misma tasa de falla l i (t).

Probabilidad de tiempo de actividad P (t) representa la probabilidad de que dentro de un período de tiempo específico t, la falla del dispositivo no ocurrirá. Este indicador está determinado por la proporción de la cantidad de dispositivos que han funcionado sin fallas hasta el momento del tiempo t al número total de dispositivos operativos en el momento inicial.



Por ejemplo, la probabilidad de tiempo de actividad P (t) \u003d 0.9 representa la probabilidad de que dentro del período de tiempo especificado t \u003d 500 horas, ocurra una falla en (10-9 \u003d 1) un dispositivo de cada diez, y 9 de cada 10 dispositivos funcionen sin fallas.

Probabilidad de tiempo de actividad P (t) \u003d 0,8 representa la probabilidad de que dentro del período de tiempo especificado t \u003d 1000 horas, dos 2 dispositivos de cada cien fallen, y de 100 dispositivos, 80 dispositivos funcionen sin fallas.

Probabilidad de tiempo de actividad P (t) \u003d 0,975 representa la probabilidad de que dentro del período de tiempo especificado t \u003d 2500 horas, 1000-975 \u003d 25 dispositivos de cada mil fallarán y 975 dispositivos funcionarán sin fallas.

Cuantitativamente, la confiabilidad de un dispositivo se evalúa como la probabilidad P (t) de un evento de que el dispositivo realice sus funciones de manera confiable durante el tiempo de 0 a t. El valor P (t) es la probabilidad de que no haya fallas (el valor calculado de P (t) no debe ser inferior a 0,85) el trabajo se determina mediante la expresión

donde t es el tiempo de funcionamiento del sistema, h (t se selecciona de la serie: 1000, 2000, 4000, 8000, 10000 horas);

λ es la tasa de falla del dispositivo, 1 / h;

T 0 - MTBF, h.

El cálculo de confiabilidad consiste en encontrar la tasa de falla total λ del dispositivo y el MTBF:

El tiempo de recuperación de un dispositivo en caso de falla incluye el tiempo para encontrar un artículo defectuoso, el tiempo para reemplazarlo o repararlo y el tiempo para probar la funcionalidad del dispositivo.

El tiempo medio de recuperación T en dispositivos eléctricos se puede seleccionar en el rango de 1, 2, 4, 6, 8, 10, 12, 18, 24, 36, 48 horas. Los valores más pequeños corresponden a dispositivos con alta capacidad de reparación. El tiempo medio de recuperación T in se puede reducir mediante control integrado o autodiagnóstico, diseño modular de componentes, instalación disponible.

El valor del factor de disponibilidad está determinado por la fórmula

donde T 0 - MTBF, h.

T in - tiempo medio de recuperación, h.

La confiabilidad de los elementos depende en gran medida de sus condiciones eléctricas y de temperatura. Para aumentar la confiabilidad, los elementos deben usarse en modos ligeros determinados por los factores de carga.

Factor de carga - es la relación entre el parámetro calculado del elemento en el modo de funcionamiento y su valor máximo permitido. Los factores de carga de diferentes elementos pueden variar mucho.

Al calcular la confiabilidad de un dispositivo, todos los elementos del sistema se dividen en grupos de elementos del mismo tipo y los mismos factores de carga K n.

La tasa de falla del elemento i-ésimo está determinada por la fórmula

(10.3)

donde K n i es el factor de carga, calculado en los mapas de modos de operación, o conjunto asumiendo que el elemento opera en modos normales, en el Apéndice D se dan los valores de los factores de carga de los elementos;

λ 0і: la tasa de falla básica del enésimo elemento se proporciona en el Apéndice D.

A menudo, para calcular la confiabilidad, se utilizan los datos sobre la tasa de falla λ 0і de los elementos análogos.

Ejemplo de cálculo de la fiabilidad del dispositivo que consiste en un BT-85W complejo comprado de producción importada y una fuente de energía desarrollada sobre la base de una producción en serie.

La tasa de falla de los productos importados se determina como el recíproco del tiempo de operación (a veces se toma el período de garantía para el servicio del producto) en función de la operación por día de un cierto número de horas.

El período de garantía del producto importado comprado es de 5 años, el producto funcionará 14.24 horas diarias:

T \u003d 14,24 horas x 365 días x 5 años \u003d 25981 horas - MTBF.

10-6 1 / hora - tasa de fallas.

Los cálculos y los datos iniciales se realizan en una computadora usando programas de Excel y se dan en las tablas 10.1 y 10.2. En la tabla 10.1 se da un ejemplo de cálculo.

Tabla 10.1 - Cálculo de la confiabilidad del sistema

Nombre y tipo de elemento o análogo Coeficiente, carga, K n i
λ i * 10 -6, 1 / h λ yo * K norte yo * 10 -6 1 / h Número n i, n і * λ i * 10 -6, 1 / h
BT-85W complejo 1,00 38,4897 38,4897 38,4897
Condensador K53 0,60 0,0200 0,0120 0,0960
Zócalo (enchufe) SNP268 0,60 0,0500 0,0300 0,0900
Chip TRS 0,50 0,0460 0,0230 0,0230
Resistencia OMLT 0,60 0,0200 0,0120 0,0120
Enlace fusible VP1-1 0,30 0,1040 0,0312 0,0312
Diodo Zener 12V 0,50 0,4050 0,2500 0,4050
Indicador 3L341G 0,20 0,3375 0,0675 0,0675
Interruptor de botón 0,30 0,0100 0, 0030 0,0030
Fotodiodo 0,50 0,0172 0,0086 0,0086
Conexión soldada 0,40 0,0001 0,0004 0,0004
Alambre, m 0,20 0,0100 0,0020 0,2 0,0004
Conexión de soldadura 0,50 0,0030 0,0015 0,0045
l dispositivo completo å \u003d 39,2313

Determine la tasa general de fallas del dispositivo

Entonces el MTBF según la expresión (10.2) y, en consecuencia, es igual a

Para determinar la probabilidad de una operación sin fallas durante un cierto período de tiempo, construiremos un gráfico de dependencia:

Tabla 10.2 - Cálculo de la probabilidad de funcionamiento sin fallos

t (hora)
P (t) 0,97 0,9 0,8 0,55 0,74 0,65 0,52 0,4 0,34

El gráfico de la dependencia de la probabilidad de operación sin falla del tiempo de operación se muestra en la Figura 10.1.

Figura 10.1 - Probabilidad de operación sin fallas desde el tiempo de operación

Para un dispositivo, la probabilidad de funcionamiento sin fallas generalmente se establece entre 0,82 y 0,95. De acuerdo con el gráfico de la Figura 10.1, podemos determinar para el dispositivo desarrollado a una probabilidad dada de operación sin fallas P (t) \u003d 0.82, el MTBF T o \u003d 5000 horas.

El cálculo se realiza para el caso en que la falla de cualquier elemento conduce a la falla de todo el sistema en su conjunto, dicha conexión de elementos se llama lógicamente secuencial o básica. La fiabilidad se puede aumentar mediante la redundancia.

por ejemplo... La tecnología de elementos proporciona una tasa de falla promedio de partes elementales l i \u003d 1 * 10-5 1 / h ... Cuando se usa en un dispositivo N \u003d 1 * 10 4 partes elementales la tasa total de fallas l o \u003d N * li \u003d 10 -1 1 / h ... Entonces el tiempo medio de falla del dispositivo es Hasta \u003d 1 / lo \u003d 10 h) Si el dispositivo se ejecuta sobre la base de 4 dispositivos idénticos conectados en paralelo, entonces el tiempo de actividad medio aumentará en N / 4 \u003d 2500 veces y será de 25000 horas o 34 meses o aproximadamente 3 años.

Las fórmulas permiten calcular la confiabilidad de un dispositivo si se conocen los datos iniciales: la composición del dispositivo, el modo y las condiciones de su funcionamiento, la tasa de falla de sus elementos.

Distinguir entre indicadores probabilísticos (matemáticos) y estadísticos de confiabilidad. Los indicadores matemáticos de confiabilidad se derivan de funciones de distribución teóricas de la probabilidad de fallas. Los indicadores de confiabilidad estadística se determinan empíricamente cuando se prueban instalaciones en base a datos estadísticos sobre el funcionamiento del equipo.

La confiabilidad es una función de muchos factores, la mayoría de los cuales son aleatorios. Por tanto, está claro que se necesitan una gran cantidad de criterios para evaluar la fiabilidad de un objeto.

El criterio de confiabilidad es una característica por la cual se evalúa la confiabilidad de un objeto.

Los criterios y características de confiabilidad son de naturaleza probabilística, ya que los factores que afectan al objeto son de naturaleza aleatoria y requieren una evaluación estadística.

Las características cuantitativas de fiabilidad pueden ser:
probabilidad de funcionamiento sin fallos;
tiempo de actividad promedio;
tasa de fracaso;
tasa de fracaso;
varios factores de seguridad.

1. Probabilidad de tiempo de actividad

Sirve como uno de los principales indicadores para calcular la confiabilidad.
La probabilidad de funcionamiento sin fallos de un objeto se denomina probabilidad de que mantenga sus parámetros dentro de límites especificados durante un cierto período de tiempo en determinadas condiciones de funcionamiento.

En el futuro, asumimos que la operación del objeto ocurre continuamente, la duración de la operación del objeto se expresa en unidades de tiempo t, y la operación se inició en el momento del tiempo t \u003d 0.
Denotamos por P (t) la probabilidad de que un objeto funcione sin fallas durante un período de tiempo. La probabilidad, considerada como una función del límite superior del intervalo de tiempo, también se denomina función de confiabilidad.
Estimación probabilística: P (t) \u003d 1 - Q (t), donde Q (t) es la probabilidad de falla.

Es obvio del gráfico que:
1. P (t) - función no creciente del tiempo;
2. 0 ≤ P (t) ≤ 1;
3. P (0) \u003d 1; P (∞) \u003d 0.

En la práctica, a veces una característica más conveniente es la probabilidad de que un objeto funcione mal o la probabilidad de falla:
Q (t) \u003d 1 - P (t).
Característica estadística de la probabilidad de falla: Q * (t) \u003d n (t) / N

2. Tasa de fracaso

La tasa de fallos es la relación entre el número de objetos fallidos y su número total antes del inicio de la prueba, siempre que los objetos fallidos no se reparen o sustituyan por otros nuevos, es decir,

a * (t) \u003d n (t) / (NΔt)
donde a * (t) es la tasa de fallas;
n (t) es el número de objetos fallidos en el intervalo de tiempo de t - t / 2 a t + t / 2;
Δt es el intervalo de tiempo;
N es el número de objetos que participan en la prueba.

La tasa de falla es la densidad de la distribución del tiempo de operación del producto antes de su falla. Determinación probabilística de la tasa de falla a (t) \u003d -P (t) o a (t) \u003d Q (t).

Por lo tanto, existe una relación inequívoca entre la tasa de falla, la probabilidad de operación sin fallas y la probabilidad de fallas para cualquier ley de distribución del tiempo de falla: Q (t) \u003d ∫ a (t) dt.

El rechazo se interpreta en la teoría de la fiabilidad como un evento aleatorio. La teoría se basa en la interpretación estadística de la probabilidad. Los elementos y sistemas formados a partir de ellos se consideran objetos de masa pertenecientes a una población general y que operan en condiciones estadísticamente homogéneas. Cuando hablamos de un objeto, en esencia se refieren a un objeto tomado al azar de la población general, una muestra representativa de esta población y, a menudo, de toda la población general.

Para objetos de masa, se puede obtener una estimación estadística de la probabilidad de operación sin falla P (t) procesando los resultados de las pruebas de confiabilidad de muestras suficientemente grandes. La forma en que se calcula la puntuación depende del plan de prueba.

Deje que las pruebas de una muestra de N objetos se realicen sin reemplazos ni restauraciones hasta que falle el último objeto. Designemos la duración del tiempo hasta la falla de cada uno de los objetos t 1, ..., t N. Entonces la estimación estadística es:

P * (t) \u003d 1 - 1 / N ∑η (t-t k)

donde η es la función de la unidad de Heaviside.

Para la probabilidad de operación sin fallas en un segmento determinado, es conveniente estimar P * (t) \u003d / N,
donde n (t) es el número de objetos que han fallado en el tiempo t.

La tasa de falla, determinada bajo la condición de reemplazar los productos defectuosos por productos reparables, a veces se denomina tasa de falla promedio y se denota por ω (t).

3. Tasa de fracaso

La tasa de fallos λ (t) es la relación entre el número de objetos fallidos por unidad de tiempo y el número medio de objetos en funcionamiento en un período de tiempo determinado, siempre que los objetos fallidos no se restauren y no se sustituyan por otros útiles: λ (t) \u003d n (t) /
donde N cf \u003d / 2 es el número promedio de objetos que funcionaron correctamente en el intervalo de tiempo Δt;
N i - el número de productos que funcionaron al comienzo del intervalo Δt;
N i + 1: el número de objetos que funcionaron correctamente al final del intervalo de tiempo Δt.

Las pruebas de recursos y las observaciones en grandes muestras de objetos muestran que, en la mayoría de los casos, la tasa de fallas cambia de manera no monótona con el tiempo.

De la curva de dependencia de los rechazos en el tiempo se puede ver que todo el período de operación de la instalación se puede dividir condicionalmente en 3 períodos.
Yo - punto - rodando.

Las fallas de rodaje son, por regla general, el resultado de defectos y elementos defectuosos en el objeto, cuya confiabilidad es significativamente menor que el nivel requerido. Con un aumento en la cantidad de elementos en un producto, incluso con el control más estricto, no es posible excluir por completo la posibilidad de que elementos que tienen ciertos defectos ocultos ingresen al ensamblaje. Además, los errores durante el montaje y la instalación, así como un desarrollo insuficiente de la instalación por parte del personal de servicio, pueden provocar fallas durante este período.

La naturaleza física de tales fallas es de naturaleza aleatoria y se diferencia de las fallas repentinas del período normal de operación en que las fallas pueden ocurrir aquí no con cargas mayores, sino también insignificantes ("quema de elementos defectuosos").
Una disminución en el valor de la tasa de falla del objeto en su conjunto, con un valor constante de este parámetro para cada uno de los elementos por separado, se explica precisamente por el “quemado” de los eslabones débiles y su reemplazo por los más confiables. Cuanto más pronunciada sea la curva en esta zona, mejor: quedarán menos elementos defectuosos en el producto en poco tiempo.

Para mejorar la confiabilidad de la instalación, teniendo en cuenta la posibilidad de fallas por robo, debe:
realizar un rechazo más estricto de elementos;
realizar pruebas del objeto en modos cercanos a los operativos y utilizar solo los elementos que hayan pasado las pruebas durante el montaje;
mejorar la calidad del montaje y la instalación.

El tiempo medio de rodaje se determina durante las pruebas. Para casos especialmente importantes, es necesario aumentar el período de rodaje varias veces en comparación con la media.

II - th período - funcionamiento normal
Este período se caracteriza por el hecho de que los fallos de rodaje ya han finalizado y aún no se han producido fallos relacionados con el desgaste. Este período se caracteriza por fallas extremadamente repentinas de elementos normales, cuyo MTBF es muy alto.

La retención del nivel de tasa de falla en esta etapa se caracteriza por el hecho de que el elemento fallado es reemplazado por el mismo con la misma probabilidad de falla, y no el mejor como sucedió durante la etapa de rodaje.

El rechazo y rodaje preliminar de los elementos que van a sustituir a los fallidos es aún más importante para esta etapa.
El diseñador tiene las mayores capacidades para resolver este problema. A menudo, un cambio de diseño o una reducción de los modos de funcionamiento de solo uno o dos elementos proporciona un fuerte aumento en la confiabilidad de toda la instalación. La segunda forma es mejorar la calidad de producción e incluso la limpieza de producción y operación.

III - período - desgaste
El período de operación normal termina cuando comienzan a ocurrir fallas por desgaste. Comienza el tercer período de la vida útil del producto: el período de uso.

La probabilidad de fallas debido al desgaste aumenta a medida que se acerca la vida útil.

Desde un punto de vista probabilístico, una falla del sistema en un intervalo de tiempo dado Δt \u003d t 2 - t 1 se define como la probabilidad de falla:

∫a (t) \u003d Q 2 (t) - Q 1 (t)

La tasa de falla es la probabilidad condicional de que ocurra una falla durante el intervalo de tiempo Δt, siempre que no haya ocurrido antes de λ (t) \u003d / [ΔtP (t)]
λ (t) \u003d lim / [ΔtP (t)] \u003d / \u003d Q "(t) / P (t) \u003d -P" (t) / P (t)
dado que a (t) \u003d -P "(t), entonces λ (t) \u003d a (t) / P (t).

Estas expresiones establecen la relación entre la probabilidad de funcionamiento sin fallas, la frecuencia y la tasa de fallas. Si a (t) es una función no creciente, entonces la siguiente relación es verdadera:
ω (t) ≥ λ (t) ≥ a (t).

4. MTBF

MTBF es la expectativa matemática del tiempo de actividad.

Definición probabilística: el tiempo medio hasta la falla es igual al área bajo la curva de probabilidad de falla.

Definición estadística: T * \u003d ∑θ i / N 0
donde θ I es el tiempo de funcionamiento del i-ésimo objeto hasta la falla;
N 0: el número inicial de objetos.

Es obvio que el parámetro T * no puede caracterizar completa y satisfactoriamente la confiabilidad de los sistemas duraderos, ya que es una característica de confiabilidad solo hasta la primera falla. Por lo tanto, la confiabilidad de los sistemas a largo plazo se caracteriza por el tiempo promedio entre dos fallas adyacentes o el tiempo medio entre fallas t av:
t cf \u003d ∑θ i / n \u003d 1 / ω (t),
donde n es el número de fallas durante el tiempo t;
θ i es el tiempo de funcionamiento del objeto entre las fallas (i-1) y la i-ésima.

MTBF es el valor promedio del tiempo entre fallas adyacentes, siempre que se restaure el elemento fallado.

Al considerar las leyes de distribución de fallas, se encontró que las tasas de falla de los elementos pueden ser constantes o cambiar según el tiempo de operación. Para los sistemas a largo plazo, que incluyen todos los sistemas de transporte, se contempla un mantenimiento preventivo, que prácticamente elimina el efecto de fallas por desgaste, por lo que solo ocurren fallas repentinas.

Esto simplifica enormemente el cálculo de la fiabilidad. Sin embargo, los sistemas complejos se componen de muchos elementos conectados de diferentes formas. Cuando el sistema está en funcionamiento, algunos de sus elementos funcionan continuamente, otros, solo a ciertos intervalos, y otros más, realizan solo breves operaciones de encendido o conexión. En consecuencia, durante un período de tiempo determinado, solo algunos de los elementos tienen el mismo tiempo de funcionamiento que el tiempo de funcionamiento del sistema, mientras que otros funcionan durante un tiempo más corto.

En este caso, para calcular el tiempo de funcionamiento de un sistema dado, solo se considera el tiempo durante el cual el elemento está encendido; Este enfoque es posible si se supone que durante los períodos en los que los elementos no están incluidos en la operación del sistema, su tasa de fallas es cero.

Desde el punto de vista de la fiabilidad, el esquema más común de conexión en serie de elementos. En este caso, el cálculo utiliza la regla del producto de confiabilidad:

dónde R (t i) - fiabilidad i-ésimo elemento que enciende yo horas del tiempo de actividad total del sistema t h.


Para los cálculos, el llamado

tasa de empleo igual a

es decir, la relación entre el tiempo de funcionamiento del elemento y el tiempo de funcionamiento del sistema. El significado práctico de este coeficiente es que para un elemento con una tasa de falla conocida, la tasa de falla en el sistema, teniendo en cuenta el tiempo de operación, será igual a

El mismo enfoque se puede utilizar en relación con los nodos del sistema individuales.

Otro factor a considerar al analizar la confiabilidad del sistema es el nivel de carga de trabajo con el que operan los elementos en el sistema, ya que determina en gran medida la magnitud de la tasa de falla esperada.

La tasa de falla de los elementos cambia significativamente incluso con pequeños cambios en la carga de trabajo que actúa sobre ellos.

En este caso, la principal dificultad en el cálculo se debe a una variedad de factores que determinan tanto el concepto de resistencia del elemento como el concepto de carga.

La resistencia de un elemento combina su resistencia al estrés mecánico, vibración, presión, aceleración, etc. La categoría de resistencia también incluye resistencia al estrés térmico, resistencia eléctrica, resistencia a la humedad, resistencia a la corrosión y una serie de otras propiedades. Por lo tanto, la fuerza no se puede expresar en algún valor numérico y no existen unidades de fuerza que tengan en cuenta todos estos factores. Las manifestaciones de la carga también son múltiples. Por lo tanto, para evaluar la resistencia y la carga, se utilizan métodos estadísticos, con la ayuda de los cuales se determina el efecto observado de la falla del elemento a lo largo del tiempo bajo la acción de varias cargas o bajo la acción de una carga predominante.

Los elementos están diseñados para soportar las cargas nominales. Durante el funcionamiento de los elementos en las condiciones de cargas nominales, se observa una cierta regularidad de la intensidad de sus fallas repentinas. Esta tasa se denomina tasa de falla repentina nominal de los elementos y es el punto de partida para determinar la tasa de falla repentina real del elemento real (teniendo en cuenta el tiempo de operación y la carga de trabajo).

Para un elemento o sistema real, actualmente se consideran tres influencias ambientales principales: mecánicas, térmicas y cargas de trabajo.

La influencia de las influencias mecánicas se tiene en cuenta mediante un coeficiente, cuyo valor está determinado por el lugar de instalación del equipo, y se puede tomar igual a:

para laboratorios y salas confortables - 1

, instalaciones terrestres estacionarias - 10

, material rodante ferroviario - 30.

Tasa de falla repentina clasificada seleccionada por

lengüeta. 3, debe aumentarse en tiempos dependiendo del lugar de instalación del dispositivo en funcionamiento.

Curvas en la Fig. 7 ilustran la naturaleza general del cambio en la intensidad de fallas repentinas de componentes eléctricos y electrónicos dependiendo de la temperatura de calentamiento y la magnitud de la carga de trabajo.

La intensidad de los fallos repentinos con un aumento de la carga de trabajo, como se puede ver en las curvas anteriores, aumenta según la ley logarítmica. Estas curvas también muestran cómo se puede reducir la tasa de fallas repentinas de elementos incluso a un valor por debajo del valor nominal. Se logra una reducción significativa en la tasa de fallas repentinas si los elementos operan con cargas por debajo de sus valores nominales.


Figura: dieciséis

Figura: 7 se puede utilizar al realizar cálculos aproximados (educativos) de la fiabilidad de cualquier elemento eléctrico y electrónico. El modo nominal en este caso corresponde a una temperatura de 80 ° C y el 100% de la carga de trabajo.

Si los parámetros calculados del elemento difieren de los valores nominales, entonces de acuerdo con las curvas en la Fig. 7, se puede determinar el aumento de los parámetros seleccionados y la razón por la cual se multiplica el valor de la tasa de falla del elemento en cuestión.

Se puede incorporar alta confiabilidad en el diseño de elementos y sistemas. Para ello, es necesario esforzarse por reducir la temperatura de los elementos durante el funcionamiento y utilizar elementos con parámetros nominales aumentados, lo que equivale a una disminución de las cargas de trabajo.

El aumento en el costo de fabricación de un producto en cualquier caso se amortiza al reducir los costos operativos.


Tasas de falla para elementos de circuitos eléctricos
beber dependiendo de la carga se puede definir de la siguiente manera
lo mismo mediante fórmulas empíricas. En particular, dependiendo
sobre voltaje y temperatura de funcionamiento

Valor de la tabla a tensión nominal y temperatura t i.

- tasa de fallos a tensión de funcionamiento U 2 y temperatura t 2.

Se supone que la tensión mecánica permanece al mismo nivel. Dependiendo del tipo y tipo de elementos, el valor pAGS,cambia de 4 a 10, y el valor Adentro de 1.02 1.15.

Al determinar la tasa real de falla de los elementos, es necesario tener un buen conocimiento de los niveles de carga esperados a los que operarán los elementos, para calcular los valores de los parámetros eléctricos y térmicos teniendo en cuenta los modos transitorios. La identificación correcta de las cargas que actúan sobre elementos individuales conduce a un aumento significativo en la precisión de los cálculos de confiabilidad.

Al calcular la confiabilidad teniendo en cuenta las fallas por desgaste, también es necesario tener en cuenta las condiciones de funcionamiento. Valores de durabilidad METRO,dado en la tabla. 3, además de referirse a la carga nominal y las condiciones de laboratorio. Todos los elementos que operan en diferentes condiciones tienen una durabilidad que se diferencia de noah en una cantidad A La cantidad Ase puede tomar igual a:

para laboratorio - 1.0

, instalaciones en tierra - 0.3

, material rodante ferroviario - 0,17

Pequeñas fluctuaciones de coeficiente Ason posibles para equipos para diversos fines.

Para determinar la durabilidad esperada METROes necesario multiplicar la durabilidad media (nominal), determinada a partir de la tabla, por el coeficiente K.

En ausencia de los materiales necesarios para determinar la tasa de falla en función de los niveles de carga, se puede utilizar el método de coeficiente para calcular la tasa de falla.

La esencia del método de cálculo de coeficientes se reduce al hecho de que al calcular los criterios de confiabilidad del equipo, se utilizan coeficientes que relacionan la tasa de falla de elementos de varios tipos con la tasa de falla de un elemento, cuyas características de confiabilidad se conocen de manera confiable.

Se asume que la ley exponencial de confiabilidad es válida, y las tasas de falla de elementos de todo tipo varían según las condiciones de operación en la misma medida. El último supuesto significa que, en diferentes condiciones de funcionamiento, la relación

Tasa de falla de un elemento cuyas características cuantitativas son conocidas;

Factor de confiabilidad i-ésimo elemento. Un elemento con una tasa de falla de ^ 0 se denomina elemento principal del cálculo del sistema. Al calcular los coeficientes K yoel elemento principal del cálculo del sistema es la resistencia cableada. En este caso, para calcular la confiabilidad del sistema, no es necesario conocer la tasa de falla de elementos de todo tipo. Basta con conocer solo los factores de fiabilidad K yo, el número de elementos en el circuito y la tasa de falla del elemento principal del cálculo Dado que K yo tiene una dispersión de valores, entonces se verifica la confiabilidad para ambos A min y para A columpio. Los valores K yo,determinadas sobre la base del análisis de datos sobre las tasas de falla de equipos para diversos fines se dan en la tabla. 5.

Cuadro 5

La tasa de falla del elemento de cálculo principal (en este caso, la resistencia) debe determinarse como el promedio ponderado de las tasas de falla de las resistencias utilizadas en el sistema diseñado, es decir,

Y N R- tasa de fallos y número de resistencias i-ésimo tipo y denominación;

t- el número de tipos y clasificaciones de resistencias.

Es deseable construir la dependencia resultante de la confiabilidad del sistema en el tiempo de operación como para los valores A min , así que para A columpio

Teniendo información sobre la confiabilidad de los elementos individuales incluidos en el sistema, es posible dar una evaluación general de la confiabilidad del sistema y determinar los bloques y unidades que requieren mayor refinamiento. Para ello, el sistema en estudio se divide en nodos según un criterio constructivo o semántico (se elabora un diagrama estructural). La confiabilidad se determina para cada unidad seleccionada (las unidades con menor confiabilidad requieren revisión y mejora en primer lugar).

Al comparar la confiabilidad de los nodos, y más aún de las diferentes variantes de sistemas, se debe recordar que el valor absoluto de confiabilidad no refleja el comportamiento del sistema en operación y su eficiencia. El mismo valor de confiabilidad del sistema se puede lograr en un caso debido a los elementos principales, cuya reparación y reemplazo requiere un tiempo considerable y grandes costos de material (para una locomotora eléctrica, retiro de la operación del tren), en otro caso, estos son elementos pequeños, que son reemplazados por el operador. por parte del personal sin retirar la máquina del trabajo. Por lo tanto, para un análisis comparativo de los sistemas diseñados, se recomienda comparar la confiabilidad de elementos similares en su importancia y las consecuencias derivadas de sus fallas.

Para cálculos de confiabilidad aproximados, puede utilizar los datos de la experiencia operativa de sistemas similares. que en cierta medida tiene en cuenta las condiciones de funcionamiento. El cálculo en este caso se puede realizar de dos formas: por el nivel medio de fiabilidad del mismo tipo de equipo o por el factor de conversión a condiciones reales de funcionamiento.

El cálculo del nivel medio de fiabilidad se basa en el supuesto de que el equipo diseñado y la muestra operada son iguales. Esto se puede permitir con los mismos elementos, sistemas similares y la misma proporción de elementos en el sistema.

La esencia del método es que

Y - el número de elementos y el MTBF del equipo - muestra;

Y lo mismo para el equipo diseñado. A partir de esta relación, es fácil determinar el MTBF para el equipo diseñado:

La ventaja del método es su sencillez. Desventajas: la ausencia, por regla general, de una muestra del equipo operativo adecuada para comparar con el dispositivo diseñado.

El cálculo mediante el segundo método se basa en la determinación del factor de conversión, que tiene en cuenta las condiciones de funcionamiento de equipos similares. Para determinarlo, se selecciona un sistema similar que se opera en condiciones específicas. Es posible que no se cumplan otros requisitos. Para el sistema operativo seleccionado, los indicadores de confiabilidad se determinan utilizando los datos de la Tabla. 3, los mismos datos de rendimiento se determinan por separado.

El factor de conversión se define como la relación

- MTBF según datos de funcionamiento;

T oz- MTBF por cálculo.

Para el equipo diseñado, los indicadores de confiabilidad se calculan utilizando los mismos datos tabulares que para el sistema operado. Entonces los resultados obtenidos se multiplican por Para e.

Coeficiente Para etiene en cuenta las condiciones reales de funcionamiento, - las reparaciones preventivas y su calidad, la sustitución de piezas entre reparaciones, la cualificación del personal de mantenimiento, el estado del equipo del depósito, etc., que no pueden preverse con otros métodos de cálculo. Los valores Para epuede haber más de uno.

Cualquiera de los métodos de cálculo considerados se puede realizar para una confiabilidad determinada, es decir, por el método opuesto, desde la confiabilidad del sistema y el MTBF hasta la elección de indicadores de los elementos constituyentes.

Tasa de fracaso- la densidad condicional de la probabilidad de falla de un objeto no recuperable, determinada para el momento considerado, siempre que no haya ocurrido ninguna falla antes de ese momento.

Así, estadísticamente, la tasa de fallas es igual al número de fallas que ocurrieron por unidad de tiempo, referido al número de objetos que no fallaron en un momento dado.

Un cambio típico en la tasa de fallas a lo largo del tiempo se muestra en la Fig. 5.

La experiencia de operar sistemas complejos muestra que el cambio en la tasa de falla λ ( t) se describe la mayor parte del número de objetos U - curva en forma.

El tiempo se puede dividir condicionalmente en tres secciones características: 1. El período de rodaje. 2. Periodo de funcionamiento normal. 3. El período de envejecimiento del objeto.

Figura: 5. Cambio típico en la tasa de fallas

El período de rodaje de un objeto tiene una mayor tasa de fallas causadas por fallas de rodaje causadas por defectos en la producción, instalación y puesta en servicio. A veces, el final de este período está asociado con el servicio de garantía del objeto, cuando el fabricante realiza la eliminación de fallas. Durante el funcionamiento normal, la tasa de averías se mantiene prácticamente constante, mientras que las averías son de naturaleza aleatoria y aparecen repentinamente, principalmente debido a cambios aleatorios de carga, incumplimiento de las condiciones de funcionamiento, factores externos desfavorables, etc. Es este período el que corresponde al tiempo de funcionamiento principal de la instalación.

El aumento en la tasa de fallas se refiere al período de envejecimiento del objeto y es causado por el aumento en el número de fallas debido al desgaste, envejecimiento y otras razones asociadas con la operación a largo plazo. Es decir, la probabilidad de falla de un elemento que ha sobrevivido por el momento t en algún intervalo de tiempo posterior depende de los valores de λ ( tu) solo en este intervalo y, por lo tanto, la tasa de falla es un indicador local de la confiabilidad del elemento en un intervalo de tiempo dado.

Tema 1.3. Fiabilidad de los sistemas recuperables

Los sistemas de automatización modernos son sistemas recuperables complejos. Dichos sistemas se reparan en el proceso de operación, en caso de falla de algunos elementos, y continúan trabajando. La propiedad de los sistemas a restaurar en el proceso de trabajo se "establece" durante su diseño y se garantiza durante la fabricación, y la realización de operaciones de reparación y restauración está prevista en la documentación normativa y técnica.

La realización de medidas de reparación y restauración es esencialmente otra forma destinada a aumentar la fiabilidad del sistema.

1.3.1. Indicadores de confiabilidad de los sistemas restaurados

Desde el punto de vista cuantitativo, dichos sistemas, además de los indicadores de confiabilidad considerados anteriormente, también se caracterizan por indicadores de confiabilidad complejos.

Un indicador complejo de confiabilidad es un indicador de confiabilidad que caracteriza varias propiedades que componen la confiabilidad de un objeto.

Los indicadores de confiabilidad complejos que se utilizan más ampliamente para caracterizar la confiabilidad de los sistemas restaurados son:

Relación de disponibilidad;

Índice de disponibilidad operativa;

Tasa de utilización técnica.

Relación de disponibilidad- la probabilidad de que el objeto esté en un estado de trabajo en un momento arbitrario de tiempo, a excepción de las pausas planificadas, durante las cuales no se proporciona el uso del objeto para el propósito previsto.

Por lo tanto, el factor de disponibilidad caracteriza simultáneamente dos propiedades diferentes de un objeto: confiabilidad y mantenibilidad.

La disponibilidad es un parámetro importante, sin embargo, no es universal.

Índice de disponibilidad operativa- la probabilidad de que el objeto esté en un estado de trabajo en un momento arbitrario de tiempo, a excepción de las pausas planificadas, durante las cuales no se proporciona el uso del objeto para el propósito previsto y, a partir de ese momento, funcionará sin fallas durante un intervalo de tiempo determinado.

El coeficiente caracteriza la confiabilidad de los objetos, cuya necesidad de uso surge en un momento arbitrario, después de lo cual se requiere una cierta operación sin fallas. Hasta este momento, el equipo puede estar en modo de espera, el modo de uso en otras funciones de trabajo.

Tasa de utilización técnica- la relación de la expectativa matemática de los intervalos de tiempo para la permanencia de los objetos en un estado de trabajo durante un cierto período de operación a la suma de las expectativas matemáticas de los intervalos de tiempo que el objeto está en un estado de trabajo, tiempo de inactividad debido al mantenimiento y reparaciones para el mismo período de operación