博客
关于我
【Lintcode】1900. Gene Similarity
阅读量:198 次
发布时间:2019-02-28

本文共 2835 字,大约阅读时间需要 9 分钟。

基因序列的解析与比较是解决本题的关键步骤。以下是详细的解析过程:

  • 基因序列解析:每个基因序列由数字和字母组成,数字表示后续重复的字母次数。例如,"2T3G" 解析为 "TTGGG"。解析过程需要识别每个数字和后续的字母,生成区间表示。

  • 区间比较:将每个基因序列分解为多个区间,每个区间由字符和长度组成。比较两个区间的长度,逐个字符进行比较,统计相同位置的数量。

  • 相同位置统计:比较两个区间的字符,如果相同,则增加计数,缩短较长区间的长度,继续比较剩余部分,直到所有区间都被处理完。

  • 通过上述步骤,可以准确地找出两个基因序列相同的位置数量,并计算总基因长度。

    以下是代码的优化版本:

    public class Solution {    class Gene {        char ch;        int len;        public Gene(char ch, int len) {            this.ch = ch;            this.len = len;        }    }    public String GeneSimilarity(String Gene1, String Gene2) {        int count = 0;        int totalLen1 = 0;        int totalLen2 = 0;        int idx1 = 0;        int idx2 = 0;        Gene currentG1 = new Gene(' ', 0);        Gene currentG2 = new Gene(' ', 0);        while (idx1 < Gene1.length() || idx2 < Gene2.length()) {            if (currentG1.len == 0) {                // 解析Gene1的下一个区间                int i1 = idx1;                while (i1 < Gene1.length() && Character.isDigit(Gene1.charAt(i1))) {                    i1++;                }                if (i1 > idx1) {                    char c1 = Gene1.charAt(i1);                    int len1 = Integer.parseInt(Gene1.substring(idx1, i1));                    currentG1 = new Gene(c1, len1);                    totalLen1 += len1;                    idx1 = i1 + 1;                } else {                    // 无法解析下一个区间,结束循环                    break;                }            }            if (currentG2.len == 0) {                // 解析Gene2的下一个区间                int i2 = idx2;                while (i2 < Gene2.length() && Character.isDigit(Gene2.charAt(i2))) {                    i2++;                }                if (i2 > idx2) {                    char c2 = Gene2.charAt(i2);                    int len2 = Integer.parseInt(Gene2.substring(idx2, i2));                    currentG2 = new Gene(c2, len2);                    totalLen2 += len2;                    idx2 = i2 + 1;                } else {                    // 无法解析下一个区间,结束循环                    break;                }            }            // 比较当前区间            int minLen1 = Math.min(currentG1.len, currentG2.len);            if (currentG1.ch == currentG2.ch) {                count += minLen1;                // 更新当前区间长度                currentG1.len -= minLen1;                currentG2.len -= minLen1;            } else {                // 字符不同,不增加计数            }            // 检查是否有任何区间剩余            if (currentG1.len > 0 || currentG2.len > 0) {                // 进入下一个循环会自动处理            } else {                // 两个区间都处理完毕,退出循环                break;            }        }        return count + "/" + (totalLen1 + totalLen2);    }}

    解释

  • Gene类:用于存储当前区间的字符和长度。
  • GeneSimilarity方法
    • 初始化变量,记录计数、总长度和当前比较位置。
    • 使用循环处理每个区间,直到两个基因序列都被比较完。
    • 解析基因序列,生成区间,并记录总长度。
    • 比较当前区间的字符和长度,更新计数和区间长度。
    • 继续处理下一个区间,直到所有区间处理完毕。
  • 通过这种方法,可以准确地找到两个基因序列相同位置的数量,并计算总基因长度。

    转载地址:http://pkjs.baihongyu.com/

    你可能感兴趣的文章
    oracle树形查询 start with connect by
    查看>>
    oracle毕业论文题目,历届毕业论文申报题目大全.doc
    查看>>
    oracle用户改名
    查看>>
    oracle用户解压不了,PLSQL developer 连接不上64位Oracle 的解决方法
    查看>>
    oracle用户解锁
    查看>>
    Oracle用游标删除重复数据
    查看>>
    oracle的内置函数
    查看>>
    Oracle的存储结构
    查看>>
    Oracle的聚合函数group by结合CUBE和ROLLUP的使用
    查看>>
    Oracle监听配置、数据库实例配置等
    查看>>
    Oracle笔记(十三) 视图、同义词、索引
    查看>>
    Oracle笔记(十) 约束
    查看>>
    Oracle系列:安装Oracle RAC数据库(二)
    查看>>
    oracle系统 介绍,ORACLE数据库管理系统介绍
    查看>>
    oracle获取数据库表、字段、注释、约束等
    查看>>
    oracle表空间查询维护命令大全之三(暂时表空间)史上最全
    查看>>
    oracle表访问方式
    查看>>
    Oracle触发器
    查看>>
    Oracle计划将ZGC项目提交给OpenJDK
    查看>>
    oracle账号共享
    查看>>