Quản lý sự cố ITIL: Tiếp cận để giải quyết

itmapasia

New Member
Quản lý sự cố ITIL: Tiếp cận để giải quyết

[IMG]

Tính liên tục trong kinh doanh đã trở thành ưu tiên hàng đầu đối với hầu hết các nhóm quản lý và các cộng sự CNTT của họ. Mỗi phút bị mất trong thời gian chết có thể dẫn đến tổng chi phí tiềm ẩn và giảm doanh thu. Điều đó nói và được thực hiện, bất kể mạng được thiết kế tốt đến đâu, sẽ có một số vấn đề và sự cố trong quá trình hoạt động của nó.

ITIL định nghĩa một cách rộng rãi sự cố là sự cố ngoài kế hoạch làm gián đoạn dịch vụ hoặc có khả năng làm gián đoạn dịch vụ nếu không được giải quyết ngay lập tức. Với cách tiếp cận Quản lý Sự cố ITIL có cấu trúc, doanh nghiệp có thể đảm bảo tác động kinh doanh tối thiểu hoặc gần như bằng không, ngay cả khi không lường trước được.

Xác định phản ứng đầu tiên để phát hiện sự cố
Ngay khi phát hiện sự cố, mục tiêu chính của Nhóm CNTT là duy trì hiệu quả mạng ở mức hiệu suất bình thường, tuân thủ các SLA tại chỗ. Nhóm CNTT cũng phải ghi lại tất cả các sự cố không được giải quyết ngay lập tức. Nếu một vấn đề có tính chất tương tự vẫn tái diễn, thì vấn đề đó phải được gắn thẻ là sự cố với kế hoạch sửa lỗi hệ thống phù hợp dẫn đến sự cố xuất hiện.

Đối với các mạng doanh nghiệp rộng lớn hơn, các Nhóm CNTT có thể bị choáng ngợp bởi số lượng và mức độ các sự cố xảy ra tại cùng một thời điểm. Do đó, để giảm thiểu thiệt hại có thể xảy ra, mỗi sự cố cần được xếp hạng về mức độ khẩn cấp, tầm quan trọng và tác động của nó đối với các quá trình quan trọng. Các sự cố được xếp hạng cao trên cả ba thông số cần được giải quyết ngay lập tức.

Thành phần quan trọng nhất trong quản lý sự cố - Bàn dịch vụ
Có vô số chức năng tham gia vào chu trình quản lý sự cố. Điều quan trọng nhất là Bàn dịch vụ. Nếu không có Bàn dịch vụ giữa người dùng và Nhóm CNTT, nhóm sau sẽ bị dồn vào việc xử lý từng vấn đề khi nó được đăng ký. Với hoạt động phi cấu trúc này, Nhóm CNTT có thể phân bổ sai nguồn lực cho các vấn đề bên lề và bỏ lỡ những vấn đề có ảnh hưởng lớn hơn.

Bộ phận Dịch vụ có thể hoạt động như một giao diện với người dùng để thu thập phản hồi về các vấn đề. Sau đó, nó có thể tổng hợp dữ liệu cần thiết và ưu tiên & ủy quyền quy trình giải quyết cho Nhóm CNTT. Bằng cách này, quy trình trở nên tinh gọn, hiệu quả và hiệu quả hơn.

Quản lý sự cố ITIL
Quản lý sự cố đóng một vai trò quan trọng trong các quy trình hàng ngày của tổ chức để khuyến khích quy trình làm việc hiệu quả và mang lại kết quả tốt nhất cho nhà cung cấp và khách hàng. Để đảm bảo nhóm hỗ trợ CNTT của bạn có đủ năng lực, hãy triển khai quy trình có cấu trúc từ báo cáo sự cố đến giải quyết sự cố.

Các bước quy trình chính liên quan đến quản lý sự cố:
Sự cố so với Lọc yêu cầu: Mỗi yêu cầu của người dùng đều được Bộ phận dịch vụ kiểm tra cẩn thận và được gắn thẻ là Sự cố hoặc Yêu cầu. Cả Sự cố và Yêu cầu đều phải có kế hoạch giải quyết cụ thể, với động lực lớn hơn cho Sự cố.

Kỹ thuật tạo tickets: Khi yêu cầu đã được lọc thành vấn đề, Bộ phận dịch vụ sẽ ghi lại một phiếu trong hệ thống doanh nghiệp với các thông tin quan trọng như Thông tin hồ sơ người dùng, Mô tả sự cố & Dữ liệu hỗ trợ.

Phân loại và Ưu tiên: Hạng mục Sự cố được Chỉ định và Mức độ ưu tiên cũng phải phản ánh rõ ràng trong cùng một phiếu sự cố. Tạo một hệ thống dựa trên quy tắc để phân loại có thể đẩy nhanh toàn bộ quá trình giải quyết. Sau khi sự cố đã được phân loại, Nhóm CNTT chịu trách nhiệm giải quyết phải có một quy trình làm việc sẵn sàng cho danh mục sự cố cụ thể đó. Bằng cách này, Bộ phận Dịch vụ có thể theo dõi, lập mô hình và hỗ trợ giải quyết từng sự cố một cách hiệu quả.

Ngay sau khi sự cố đã được phân loại chính xác, việc sắp xếp thứ tự ưu tiên sẽ trở nên dễ quản lý hơn. Bộ phận Dịch vụ hiện có thể xác định tác động trực tiếp của vấn đề đối với người dùng và các quy trình kinh doanh quan trọng. Tất cả các vấn đề có mức độ ảnh hưởng lớn hơn và cấp bách phải nằm trong danh sách ưu tiên của nhóm giải quyết vấn đề.

Quy trình đóng case: Phản hồi của người dùng phải là nguồn chính để kết thúc chu trình giải quyết sự cố. Phản hồi của người dùng có thể được sử dụng làm dữ liệu để xác định xem quá trình giải quyết vấn đề có hiệu quả hay không. Đây cũng có thể là nguồn gốc chính của các vấn đề lọc như một tập hợp các sự cố lặp lại.

Thực hiện một cách tiếp cận có quy trình đối với quản lý sự cố
Quy trình Quản lý Sự cố, thường được gọi là Vòng đời Quản lý Sự cố, là một bộ hướng dẫn tiêu chuẩn nhằm tăng cường sự hợp tác giữa các Nhóm CNTT nhằm cung cấp dịch vụ có hiệu quả. Nó có thể áp dụng cho các ngành và quy mô sự cố.

Xác định vai trò trong quy trình quản lý sự cố
Đây là những vai trò nền tảng trong Quy trình Quản lý Sự cố:

  1. Hỗ trợ Kỹ thuật Chính: Đội ngũ này, còn được gọi là Nhân viên Cấp 1, bao gồm nguồn nhân lực được giao để ứng phó đầu tiên với các báo cáo sự cố. Họ thường là thành viên của Bàn dịch vụ chịu trách nhiệm nắm bắt và phân loại các sự cố được người dùng ghi lại. Đăng bài này, chúng hoạt động theo một bộ hướng dẫn được xác định trước để khôi phục dịch vụ. Nếu họ không thể giải quyết vấn đề nhanh chóng, vấn đề sẽ được chuyển đến nhóm Hỗ trợ cấp hai hoặc cấp 2. Nhóm chính có thể là đầu mối liên hệ đầu tiên đối với các sự cố, nhưng họ không quản lý toàn bộ nhóm làm việc về sự cố.
  2. Người quản lý hoặc chủ sở hữu sự cố: Người quản lý sự cố nắm quyền sở hữu toàn bộ quy trình - từ phát hiện vấn đề đến báo cáo để giải quyết. Khi vấn đề ngày càng leo thang giữa nhóm hỗ trợ Cấp 1 và 2, Người quản lý sự cố chịu trách nhiệm phân bổ các nguồn lực gia tăng cùng với việc tập hợp một lực lượng đặc nhiệm hoặc Nhóm Sự cố lớn để giải quyết các sự cố nghiêm trọng đã xác định.
  3. Nhân viên vận hành CNTT: Đây là nhóm các cá nhân đóng vai trò là bộ đệm trong quá trình giải quyết sự cố, đảm bảo bảo trì máy chủ theo lịch trình, thực hiện sao lưu dữ liệu kịp thời và giám sát việc tuân thủ lịch trình cho các nhiệm vụ quan trọng. Họ cũng được sử dụng như một nguồn nhân lực bổ sung cho một sự cố quan trọng nếu và khi cần thiết.
  4. Nhóm Sự cố lớn: Nhóm chỉ được gọi khi vấn đề đã leo thang đến mức độ nghiêm trọng sẽ ảnh hưởng đến toàn bộ doanh nghiệp hoặc các quy trình kinh doanh quan trọng. Một nhóm năng động được tập hợp lại phù hợp với tính cấp thiết, yêu cầu chuyên môn và quy mô của vấn đề.
Phạm vi và Quy trình Quản lý Sự cố
Để thực hiện các quy trình giải quyết sự cố tiếp theo, điều quan trọng là phải xác định phạm vi sự cố. Bất kỳ trường hợp nào dẫn đến các dịch vụ bị gián đoạn có thể được gọi là sự cố. Điều này có thể bao gồm các lỗi hệ thống & nghiêm trọng hơn hoặc các thử thách bất ngờ khác như mất điện, lỗi chương trình hoặc hư hỏng phần cứng. Việc xác định phạm vi sự cố đảm bảo phân bổ nguồn lực hiệu quả vì mỗi gián đoạn nhỏ không được coi là sự cố.

Phạm vi sự cố được xác định rõ ràng dẫn đến phác thảo của Quản lý sự cố ITIL:

  • Phát hiện vấn đề: Yêu cầu của người dùng được ghi lại cùng với các đặc điểm và dữ liệu cần thiết của họ.
  • Phân loại: Dựa trên dữ liệu có sẵn, Bàn phục vụ thêm thẻ phân loại vào phiếu sự cố.
  • Điều tra nguyên nhân: Khi sự cố được ghi lại, Nhóm CNTT sẽ điều tra các nguyên nhân tiềm ẩn và thu thập dữ liệu liên quan để giải quyết thêm.
  • Khởi động Đường dây Liên lạc để Tham khảo thêm: Dữ liệu từ bước trước đó được sử dụng để giải quyết sự cố. Khi sự cố đã được giải quyết, giải pháp được ghi lại để tham khảo trong tương lai.
  • Quá trình khôi phục và đóng hệ thống: Khi sự cố được xử lý hiệu quả với một giải pháp tại chỗ, hệ thống sẽ được đưa về mức hoạt động bình thường.
  • Các biện pháp phòng ngừa dựa trên đường dây liên lạc: Sau khi sự cố được kết thúc và hệ thống đã được khôi phục, đường dây liên lạc thường xuyên được chuyển đến cùng với theo dõi của hệ thống để đảm bảo vấn đề tương tự không tái diễn.
  • Cấu trúc & Đánh giá Khung giải quyết: Khi Đường dây truyền thông chỉ đạo việc kiểm tra & cân bằng cần thiết để giải quyết các sự cố giống hệt nhau, một khuôn khổ xung quanh nó được tạo ra để giải quyết các sự cố đó. Khung này thường xuyên được đánh giá để đảm bảo khôi phục hệ thống liền mạch, với thời gian ngừng hoạt động tiếp theo hoặc gián đoạn quy trình kinh doanh quan trọng.
Tại sao Quản lý Sự cố ITIL lại Cần thiết?
ITIL Incident Management tập trung vào việc khôi phục hệ thống hiệu quả với các biện pháp phòng ngừa được thực hiện để ngăn chặn các sự cố lặp lại. Nó đảm bảo tối thiểu hoặc không có thiệt hại cho hoạt động của doanh nghiệp và giúp duy trì tính liên tục của quy trình kinh doanh, phù hợp với các mức hiệu suất được xác định trong SLA. Mục tiêu là khôi phục ngay lập tức hệ thống về Hoạt động Dịch vụ Thông thường được xác định trước, được chuẩn hóa với các thỏa thuận chung.

Quản lý sự cố: Xem qua case studies
Các sự cố thường gặp nhất thường có xu hướng thuộc các loại sau:

1. Ứng dụng không thành công

  1. Tất cả các lỗi không xác định được xác định là lỗi ứng dụng và được chỉ định cho một nhóm phản hồi đã xác định trước.
  2. Lỗi dữ liệu thường là điểm khởi đầu của các lỗi hệ thống và làm gián đoạn hoạt động kinh doanh. Các biện pháp đặc biệt được thực hiện để đảm bảo tính toàn vẹn của nó.
  3. Ngay cả những lỗi nhỏ nhất trong một gói phần mềm hoặc một nền tảng trực tuyến cũng có thể khiến người dùng bỏ đi. Do đó, các sự cố không được xác định dựa trên quy mô và tác động chung của chúng đến hoạt động kinh doanh của người dùng và mức độ.
2. Lỗi phần cứng

  1. Máy chủ là hệ thống trung tâm để lưu trữ và làm cho tài sản kỹ thuật số có thể truy cập được cho cả khách hàng bên trong và bên ngoài của doanh nghiệp. Nếu các sự cố dựa trên máy chủ không được giải quyết ngay lập tức, chúng có thể ảnh hưởng đến tất cả các quy trình của doanh nghiệp.
  2. Sự cố Kết nối mạng thường làm gián đoạn giao tiếp qua email và trò chuyện video có thể ảnh hưởng trực tiếp đến các quy trình kinh doanh quan trọng và hoạt động hàng ngày.
  3. Chế độ ngừng hoạt động của hệ thống doanh nghiệp có ảnh hưởng trực tiếp đến hoạt động của nguồn nhân lực. Với các bản sao lưu hệ thống đầy đủ, công ty có thể tiếp tục các hoạt động hàng ngày ngay cả khi các quy trình giải quyết sự cố được khởi chạy.
Kết luận
Quản lý sự cố phụ thuộc nhiều vào Bàn dịch vụ. Nó phân tích việc đăng ký các sự cố trên các danh mục cùng với các mốc thời gian giải quyết. Sau khi sự cố được xử lý và kết thúc, công ty có thể tập trung vào việc tổng hợp dữ liệu để nâng cao chất lượng dịch vụ và thực hiện các biện pháp phòng ngừa để loại bỏ sự cố phát sinh ngay từ đầu.

Trong khi giữ người dùng là trung tâm của quá trình giải quyết, Quản lý sự cố đảm bảo rằng mỗi sự cố được giải quyết một cách hiệu quả, theo sau là tài liệu và phân tích chuyên sâu về từng sự cố. Các quy trình nghiêm ngặt như vậy đảm bảo rằng mỗi sự cố sẽ bổ sung cho công ty kiến thức về các lỗ hổng trong hệ thống của mình và tạo ra giá trị bằng cách chủ động giải quyết chúng.

Để biết thêm về cách ServiceOps có thể mở khóa giá trị cho công ty của bạn, hãy xem nền tảng Motadata ServiceOps ITSM

Giờ đây, bạn có thể dùng thử miễn phí Motadata ServiceOps trong 60 ngày.

ITMAP ASIA - Đối tác của hãng Motadata tại Việt Nam

555 Trần Hưng Đạo, P. Cầu Kho, quận 1, TP.HCM

028 5404 0717 - 5404 0799
[email protected]
 
v120 viettel
Top