Pergunta

Fundo:

Há algum tempo, construí um sistema para registrar e categorizar travamentos de aplicativos para um de nossos programas internos.Na época, usei uma combinação de frequência e tempo perdido agregado (o tempo entre o lançamento do programa e a falha) para priorizar os tipos de falhas.Funcionou razoavelmente bem.

Agora, os poderes constituídos querem números sólidos sobre o custo de cada tipo de acidente que está sendo trabalhado.Ou pelo menos, números que olhar sólido.Suponho que poderia usar o tempo perdido total, multiplicado por algum número plausível, mas parece duvidoso.

Pergunta:

Existem métodos estabelecidos para calcular o custo real de falhas de aplicativos?Ou, na sua falta, estudos publicados especulando sobre tais custos?


Consenso

A precisão é impossível, mas uma estimativa baseada no tempo de atividade deverá ser suficiente se for aplicada de forma consistente e as suas limitações forem claramente documentadas.Obrigado, Matt, Orion, por dedicarem seu tempo para responder a isso.

Foi útil?

Solução

Não vi nenhum estudo, mas uma heurística razoável seria algo como:

(Tempo desde o último aplicativo salvo quando ocorreu a falha + Tempo para reiniciar o aplicativo) * Taxa média horária do operador do aplicativo.

A estimativa fica mais complexa se as falhas tiverem algum impacto sobre os clientes externos ou puderem atrasar outras coisas (ou seja,crie um gargalo de modo que outra pessoa acabe esperando porque o aplicativo de outra pessoa travou).

Dito isto, os seus “poderes constituídos” podem muito bem ficar satisfeitos com uma estimativa muito aproximada, desde que seja aplicada de forma consistente e possam ver como está a mudar ao longo do tempo.

Outras dicas

Os poderes constituídos querem números sólidos sobre o custo de cada tipo de acidente que está sendo trabalhado

Quero voar em meu balão de ar quente para Marte, mas isso não significa que tal coisa seja possível.

Sério, acho que você tem o dever de dizer a eles que não há como medir isso com precisão.Diga a eles que você pode classificar as falhas ou o que quer que possa fazer com seus dados, mas isso é tudo que você tem.

Algo como "Não conseguimos calcular quanto custa.TEMOS esses dados sobre quanto tempo as coisas estão funcionando e assim por diante, mas a única maneira de atribuir custos é fingir que X minutos equivalem a X dólares, mesmo que isso não tenha base na realidade”

Se você apenas criar algum algoritmo de custos idiota e NÃO recuar, você só será o culpado quando a gerência se virar e usar esse número arbitrário inventado para fazer algo estúpido como bombeiros ou decidir não consertar nenhuma falha e em vez disso, concentre-se em aproveitar sua sinergia com o portal sharepoint, compartilhamento na web, servidor de amor 2013

Atualizar: Para esclarecer, não estou dizendo que você deve confiar apenas em estatísticas com 100% de precisão e simplesmente desistir de todo o resto.
O que acho importante é que você saiba o que está medindo.Na verdade, você não está medindo o custo, mas sim o tempo de atividade.Como tal, você deve ser sincero sobre isso.Se você quiser estimar o custo, tudo bem, mas acredito que você precisa deixar isso claro.

Se eu produzisse esse relatório, eu chamaria de 'Relatório de tempo de atividade de falha' e talvez tivesse um campo secundário chamado "Custo estimado com base em US $ 5/minuto". Os gerentes obtêm sua estimativa de custo, mas fica claro que o relatório real é baseado no tempo de atividade, e o custo é apenas uma estimativa e como a estimativa funciona.

Há um fator faltando aqui.a maioria dos aplicativos tem um fator de 'flexão' em que as falhas repentinamente começam a "custar" muito mais porque as pessoas perdem a confiança no serviço que seu aplicativo está fornecendo.Quando isso acontecer, então pode ser muito caro fazer com que os usuários voltem a confiar e usar o sistema.

Depende...

Em termos de custo, o apenas coisa que importa é o impacto nos negócios da falha, portanto depende do tipo de aplicativo.

Para muitas aplicações, talvez não seja possível determinar o impacto nos negócios.Para outros, pode haver medidas significativas.

As medidas baseadas na procura podem ser significativas - se as vendas estiverem estáveis, o tempo de inatividade de uma aplicação de vendas pode ser útil.Se as vendas flutuarem de forma imprevisível, essas medidas serão menos úteis.

O custo do reparo também pode ser útil.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top