Estimation and Evaluation of Common Cause Failures


Software level은 아니지만, 예전에 받아놓은 자료를 대충 보다가 관심이 가서 읽어본 내용이다. 기본적인 background없이는 본론을 이해하기에는 어려움이 있는 내용이고, 단순히 introduction까지는 괜찮은 듯.

Abstract

많은 현대 어플리케이션의 성공은 복잡한 컴퓨터 기반의 시스템의 정확한 동작에 매우 의존적이다. 일부의 경우 이런 시스템들의 고장은 인간의 생명 관점에서 매우 심각한 결과를 유발할 수 있다. 인간의 생명을 위협할 수 있는 고장이 있는 시스템들을 safety-critical이라고 표현한다. SIS(Safety Instrumented System)은 안전 요구사항 명세에 정의된 안전 무결성 수준을 만족시키기 위해서 설계되어야 한다. 더욱이 SIS설계는 common mode혹은 common cause failures(CCF)를 최소화하는 방법으로 수행되어야 한다. 그러므로, process demand가 있을 때, CCF는 SIS failing to function 을 유발할 수 있다. 결과적으로 CCF는 설계 프로세스 동안 식별되어야 하고, SIS 기능의 잠재적 영향은 이해되어야만 한다. 이 문서는 estimation에 대한 상세화 및 common failure의 평가를 제공하며 1oo2시스템을 평가한다. 이 논문은 common cause failure분석의 최신 개발을 반영한다.

Introduction

fault tolerance는 시스템 자체 내의 fault에 의해 유발되는 error의 존재에도 불구하고 예상되는 서비스의 delivery를 유지하는 시스템을 구축하는 것을 허용하는 특별한 기술이다. redundancy는 4 타입으로 분류된다.[1,3,6]:

hardware redundancy
software redundancy
time redundancy
information redundancy

만약 하드웨어가 완전하다면[2, 5, 7, 8] 하드웨어 redundancy의 경우 시스템은 필요로 하는 것 보다 더 많은 하드웨어 components(e.g. channels)가 필요하다.

하드웨어 컴포넌트가 고장이 나면 여분의 하드웨어로 변경된다. 소프트웨어 redundancy의 경우 시스템은 tasks의 다른 버전으로 제공될 수 있다. time redundancy의 경우 스케줄러는 여분의 시간을 가지고 있어서 일부 tasks가 재실행되고 여전히 데드라인을 만족하도록 한다. information redundancy의 경우 데이터가 코딩이 되어 bit error가 탐지되고 복구된다.[2,6,7]. Fault tolerant system은 여러 개의 failure event가 발생하는 경우에만 fail한다.

Conclusion

CCF를 줄이기 위한 방법은 다음의 방법을 사용함으로써 달성할 수 있다.

  • Physical separation of redundant units
  • Diversity
  • Robustness of hardware (and software)
Advertisements

답글 남기기

아래 항목을 채우거나 오른쪽 아이콘 중 하나를 클릭하여 로그 인 하세요:

WordPress.com 로고

WordPress.com의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Twitter 사진

Twitter의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Facebook 사진

Facebook의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Google+ photo

Google+의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

%s에 연결하는 중