#r "nuget: BioFSharp, 2.0.0-preview.3"
#r "nuget: BioFSharp.IO, 2.0.0-preview.3"
#r "nuget: FSharp.Stats"
#r "nuget: Plotly.NET.Interactive, 4.0.0"

dssp -i <.pdb file> -o <dssp file>

type SequenceFeature = 
    {
        Name: string
        //zero-based
        Start: int
        //zero-based
        End: int
        Length: int
        Abbreviation: char
        Metadata: Map<string,string>
        FeatureType: string
    }

type AnnotatedSequence<'T when 'T :> IBioItem> = 
    {
        Tag: string
        Sequence : seq<'T>
        Features: Map<string,SequenceFeature list>
    }


open BioFSharp

let testSeq = 
    AnnotatedSequence.create
        "Test"
        ("ATGCTAGTGTCATGCTAGTGTCATGCTAGTGTCATGCTAGATGCTAGTGTCATGCTAGTGTCATGCTAGTGTCATGCTAGATGCTAGTGTCATGCTAGTGTCATGCTAGTGTCATGCTAGATGCTAGTGTCATGCTAGTGTCATGCTAGTGTCATGCTAG" |> BioArray.ofNucleotideString)
        (Map.ofList [
            "Feature1", [SequenceFeature.create("F1",0,10,'A')]
            "Feature2", [SequenceFeature.create("F2",0,10,'B'); SequenceFeature.create("F2",100,120,'B')]
            "Feature3", [SequenceFeature.create("F3",30,90,'C')]

        ])

AnnotatedSequence.format testSeq

Sequence              1 ATGCTAGTGT CATGCTAGTG TCATGCTAGT GTCATGCTAG ATGCTAGTGT CATGCTAGTG
Feature1              1 AAAAAAAAAA A                                                     
Feature2              1 BBBBBBBBBB B                                                     
Feature3              1                                  CCCCCCCCCC CCCCCCCCCC CCCCCCCCCC
Sequence             61 TCATGCTAGT GTCATGCTAG ATGCTAGTGT CATGCTAGTG TCATGCTAGT GTCATGCTAG
Feature1             61                                                                  
Feature2             61                                             BBBBBBBBBB BBBBBBBBBB
Feature3             61 CCCCCCCCCC CCCCCCCCCC CCCCCCCCCC C                               
Sequence            121 ATGCTAGTGT CATGCTAGTG TCATGCTAGT GTCATGCTAG
Feature1            121                                            
Feature2            121 B                                          
Feature3            121


open Plotly.NET
open Plotly.NET.LayoutObjects

Chart.Line(
    xy = [for i in 0..3 -> (i,1)], 
    MultiText=["A";"T";"G";"C"], 
    Opacity=0.0,
    ShowLegend = false,
    LineColor= Color.fromKeyword Black
)
|> Chart.withAnnotations (
    ["A";"T";"G";"C"]
    |> Seq.mapi (fun x text ->
        Annotation.init(
            X = x,
            Y = 1,
            Text=(string text),
            ShowArrow=false,
            Font = Font.init(Size=16.)
        )
    )
)


type Chart with
    static member SequencePlot
        (
            annotationText: #seq<string>,
            ?FontSize: float
        ) =
            let fontSize = defaultArg FontSize 16.

            Chart.Line(
                xy = [for i in 0..((Seq.length annotationText) - 1) -> (i,1)], 
                MultiText=annotationText, 
                Opacity=0.0,
                ShowLegend = false,
                LineColor= Color.fromKeyword Black
            )
            |> Chart.withXAxis(
                LinearAxis.init(
                    Visible=true, 
                    ShowLine= true, 
                    ShowTickLabels = true, 
                    ShowSpikes= true, 
                    ZeroLine = false, 
                    Range= StyleParam.Range.MinMax(0.,60.), // as default, show the first 60 characters. Double click to zoom out.
                    Title = Title.init("Sequence index (0-based)", Font=Font.init(Size=fontSize)),
                    TickFont = Font.init(Size=fontSize),
                    Ticks = StyleParam.TickOptions.Inside,
                    Mirror = StyleParam.Mirror.AllTicks
                )
            )        
            |> Chart.withYAxis(
                LinearAxis.init(Visible=false, ShowLine= false, ShowTickLabels = false, ShowGrid = false, ZeroLine=false)
            )
            |> Chart.withAnnotations (
                annotationText
                |> Seq.mapi (fun x text ->
                    Annotation.init(
                        X = x,
                        Y = 1,
                        Text=(string text),
                        ShowArrow=false,
                        Font = Font.init(Size=fontSize)
                    )
                )
            )


Chart.SequencePlot(testSeq.Sequence |> Seq.map (BioItem.symbol >> string))
|> Chart.withSize(1000)


[
    Chart.SequencePlot(testSeq.Sequence |> Seq.map (BioItem.symbol >> string))
    [
        Chart.Bar(keysValues = ["Feature1", 20], Base=10, ShowLegend = false)
        Chart.Bar(keysValues = ["Feature1", 20], Base=41, ShowLegend = false)
        Chart.Bar(keysValues = ["Feature2", 50], Base=20, ShowLegend = false)
    ]
    |> Chart.combine
]
|> Chart.SingleStack(Pattern=StyleParam.LayoutGridPattern.Coupled)
|> Chart.withSize(1000)


type Chart with
    static member SequenceFeatureView
        (
            annotatedSequence: AnnotatedSequence<_>,
            ?FontSize: float,
            ?ColorMapping: seq<(string*Color)>,
            ?ShowRangeSlider: bool
        ) =
            let showRangeSlider = defaultArg ShowRangeSlider true
            let sequenceString = annotatedSequence.Sequence |> Seq.map (BioItem.symbol >> string)

            let featureColorMap = 
                ColorMapping
                |> Option.defaultValue Seq.empty
                |> Map.ofSeq

            let featurePlots =
                annotatedSequence.Features
                |> Map.toSeq
                |> Seq.map (fun (featureName,features) ->
                    features
                    |> List.map (fun f ->
                        Chart.Bar(
                            keysValues = [featureName,f.Length-1], 
                            Width=0.8, 
                            Base=f.Start, 
                            Text = $"({f.Start}-{f.End}):  {f.Abbreviation}", 
                            TextPosition = StyleParam.TextPosition.Inside,
                            ShowLegend = false,
                            MarkerColor = (Map.tryFind featureName featureColorMap |> Option.defaultValue (Color.fromKeyword Black))
                        )
                    
                    )
                )
                |> Seq.concat

            [
                Chart.SequencePlot(sequenceString, ?FontSize = FontSize)
                |> Chart.withYAxis(
                    LinearAxis.init(Domain = StyleParam.Range.MinMax(0.81,1.))
                )

                featurePlots
                |> Chart.combine
                |> Chart.withYAxis(
                    LinearAxis.init(ShowGrid=true, FixedRange = false, Domain = StyleParam.Range.MinMax(0.,0.79))
                )
            ]
            |> Chart.SingleStack(Pattern = StyleParam.LayoutGridPattern.Coupled)
            |> fun c -> 
                if showRangeSlider then
                    c
                    |> Chart.withXAxisRangeSlider(
                        RangeSlider.init(BorderColor=Color.fromKeyword Gray, BorderWidth=1.)
                    )
                else
                    c
            |> Chart.withConfig(
                Config.init(ModeBarButtonsToAdd=[
                    StyleParam.ModeBarButton.ToggleSpikelines
                ])
            )
            |> Chart.withLayout(
                Layout.init(
                    BarMode = StyleParam.BarMode.Overlay
                )
            )
            |> Chart.withTitle $"Sequence feature view for {annotatedSequence.Tag}"


let bigTestSeq = 
    AnnotatedSequence.create
        "test sequence"
        ("ATGCTAGTGTCATGCTAGTGTCATGCTAGTGTCATGCTAGTGTCATGCTAGTGTCATGCTAGTGTCATGCTAGTGTCATGCTAGTGTCATGCTAGTGTCATGCTAGTGTC" |> BioArray.ofNucleotideString)
        (Map.ofList [
            "Feature 1", [SequenceFeature.create("F",1,33,'X');  SequenceFeature.create("F",50,60,'D')]
            "Feature 2", [SequenceFeature.create("F",0,30,'L');  SequenceFeature.create("F",40,50,'E'); SequenceFeature.create("F",52,100,'L')]
            "Feature 3", [SequenceFeature.create("F",8,83,'X');  SequenceFeature.create("F",84,100,'D')]
            "Feature 4", [SequenceFeature.create("F",80,85,'L'); SequenceFeature.create("F",40,50,'E'); SequenceFeature.create("F",52,79,'L')]            
            "Feature 5", [SequenceFeature.create("F",1,33,'X');  SequenceFeature.create("F",50,60,'D')]
            "Feature 6", [SequenceFeature.create("F",0,30,'L');  SequenceFeature.create("F",40,50,'E'); SequenceFeature.create("F",52,100,'L')]
            "Feature 7", [SequenceFeature.create("F",8,83,'X');  SequenceFeature.create("F",84,100,'D')]
            "Feature 8", [SequenceFeature.create("F",80,85,'L'); SequenceFeature.create("F",40,50,'E'); SequenceFeature.create("F",52,79,'L')]
            "Feature 9", [SequenceFeature.create("F",1,33,'X');  SequenceFeature.create("F",50,60,'D')]
            "Feature 10",[SequenceFeature.create("F",0,30,'L');  SequenceFeature.create("F",40,50,'E'); SequenceFeature.create("F",52,100,'L')]
            "Feature 11",[SequenceFeature.create("F",8,83,'X');  SequenceFeature.create("F",84,100,'D')]
            "Feature 12",[SequenceFeature.create("F",80,85,'L'); SequenceFeature.create("F",40,50,'E'); SequenceFeature.create("F",52,79,'L')]            
            "Feature 13",[SequenceFeature.create("F",1,33,'X');  SequenceFeature.create("F",50,60,'D')]
            "Feature 14",[SequenceFeature.create("F",0,30,'L');  SequenceFeature.create("F",40,50,'E'); SequenceFeature.create("F",52,100,'L')]
            "Feature 15",[SequenceFeature.create("F",8,83,'X');  SequenceFeature.create("F",84,100,'D')]
            "Feature 16",[SequenceFeature.create("F",80,85,'L'); SequenceFeature.create("F",40,50,'E'); SequenceFeature.create("F",52,79,'L')]
        ])


Chart.SequenceFeatureView(
    bigTestSeq,
    ColorMapping = ["Feature 10", Color.fromKeyword DarkSalmon] // show feature 10 in a different color
)
|> Chart.withSize(1000)

Modelling and visualizing sequence features with BioFSharp and Plotly.NET

Posted on 2021-11-5 by Kevin Schneider in Advanced

Modelling and visualizing sequence features with BioFSharp and Plotly.NET¶

Assigning secondary structure for proteins based on .pdb files¶

Comparing structural annotations¶

Implementing the Sequence feature¶

Implementing the Annotated Sequence¶

Visualizing sequence features with Plotly.NET¶

Plotting sequences with Plotly.NET¶

A sequence feature view plot for AnnotatedSequence¶